In questo lancio sperimentale, forniamo agli sviluppatori un potente strumento per il rilevamento e la localizzazione di oggetti all'interno di immagini e video. Identificando e delineando con precisione gli oggetti con i riquadri di selezione, gli sviluppatori possono sbloccare un'ampia gamma di applicazioni e migliorare l'intelligenza dei loro progetti.
Vantaggi principali:
- Semplice: integra facilmente le funzionalità di rilevamento degli oggetti nelle tue applicazioni, indipendentemente dalle tue competenze in materia di visione artificiale.
- Personalizzabile:genera riquadri di selezione in base a istruzioni personalizzate (ad es. "Voglio vedere i riquadri di selezione di tutti gli oggetti verdi in questa immagine"), senza dover addestrare un modello personalizzato.
Dettagli tecnici:
- Input:il prompt e le immagini o i fotogrammi video associati.
- Output:riquadri di delimitazione nel formato
[y_min, x_min, y_max, x_max]
. L'angolo in alto a sinistra è l'origine. Gli assix
ey
sono rispettivamente orizzontale e verticale. I valori delle coordinate sono normalizzati a 0-1000 per ogni immagine. - Visualizzazione:gli utenti di AI Studio vedranno i riquadri di selezione tracciati all'interno dell'interfaccia utente. Gli utenti di Vertex AI devono visualizzare i propri riquadri di selezione tramite codice di visualizzazione personalizzato.
Python
Installa
pip install --upgrade google-genai
Per saperne di più, consulta la documentazione di riferimento dell'SDK.
Imposta le variabili di ambiente per utilizzare l'SDK Gen AI con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True