Vertex AI proporciona dos métricas para monitorizar la IndexEndpoint
de un índice desplegado:
aiplatform.googleapis.com/matching_engine/current_shards
Número de fragmentos de la
DeployedIndex
. A medida que se añaden y se eliminan datos, la búsqueda vectorial vuelve a fragmentar automáticamente el índice para conseguir un rendimiento óptimo. Esta métrica indica el número actual de fragmentos del índice implementado.aiplatform.googleapis.com/matching_engine/current_replicas
El número total de servidores de réplica activos que usa el
DeployedIndex
. Para adaptarse al volumen de consultas, la búsqueda vectorial activa o desactiva automáticamente los servidores de réplica en función de los ajustes de réplica mínimos y máximos especificados al implementar el índice.Si el índice tiene varias particiones, cada una de ellas se puede servir usando un número diferente de servidores de réplica. Esta métrica es el número total de servidores réplica de todos los fragmentos del índice en cuestión.
Siguientes pasos
- Consulta cómo consultar tus índices para encontrar sus vecinos más cercanos.
- Consulta cómo seleccionar, consultar y mostrar estas métricas en el explorador de métricas.