En este lanzamiento experimental, proporcionamos a los desarrolladores una herramienta potente para la detección y localización de objetos en imágenes y videos. Al identificar y delimitar con precisión los objetos con cuadros delimitadores, los desarrolladores pueden desbloquear una amplia variedad de aplicaciones y mejorar la inteligencia de sus proyectos.
Beneficios clave:
- Simple: Integra fácilmente las capacidades de detección de objetos en tus aplicaciones, independientemente de tu experiencia en visión artificial.
- Personalizable: Produce cuadros de límite basados en instrucciones personalizadas (p.ej., "Quiero ver cuadros de límite de todos los objetos verdes en esta imagen"), sin tener que entrenar un modelo personalizado.
Detalles técnicos:
- Entrada: Tu instrucción y las imágenes o los fotogramas de video asociados
- Resultado: Cajas delimitadoras en formato
[y_min, x_min, y_max, x_max]
. La esquina superior izquierda es el origen. Los ejesx
yy
se extienden horizontal y verticalmente, respectivamente. Los valores de las coordenadas se normalizan de 0 a 1,000 para cada imagen. - Visualización: Los usuarios de AI Studio verán cuadros delimitadores trazados dentro de la IU. Los usuarios de Vertex AI deben visualizar sus cuadros delimitadores a través de código de visualización personalizado.
Python
Instalar
pip install --upgrade google-genai
Para obtener más información, consulta la documentación de referencia del SDK.
Establece variables de entorno para usar el SDK de IA generativa con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True