Lors de ce lancement expérimental, nous mettons à la disposition des développeurs un outil puissant de détection et de localisation d'objets dans les images et les vidéos. En identifiant et en délimitant précisément les objets avec des cadres de délimitation, les développeurs peuvent débloquer un large éventail d'applications et améliorer l'intelligence de leurs projets.
Principaux avantages :
- Simple : intégrez facilement des fonctionnalités de détection d'objets dans vos applications, quelle que soit votre expertise en vision par ordinateur.
- Personnalisable : créez des cadres de délimitation sur la base d'instructions personnalisées (par exemple, "Je souhaite voir les cadres de délimitation de tous les objets verts de cette image"), sans avoir à entraîner un modèle personnalisé.
Détails techniques :
- Entrée : votre requête et les images ou images vidéo associées.
- Sortie : cadres de délimitation au format
[y_min, x_min, y_max, x_max]
. L'angle supérieur gauche correspond à l'origine. Les axesx
ety
sont respectivement horizontaux et verticaux. Les valeurs des coordonnées sont normalisées entre 0 et 1 000 pour chaque image. - Visualisation : les utilisateurs d'AI Studio verront des cadres de délimitation tracés dans l'interface utilisateur. Les utilisateurs de Vertex AI doivent visualiser leurs cadres de délimitation à l'aide d'un code de visualisation personnalisé.
Python
Installer
pip install --upgrade google-genai
Pour en savoir plus, lisez la documentation de référence du SDK.
Définissez les variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True