Vertex AI Model Optimizer è un endpoint dinamico progettato per semplificare la selezione del modello applicando automaticamente il modello Gemini più adatto alle tue esigenze. In questo modo puoi indirizzare i prompt a un singolo meta-endpoint e il servizio selezionerà in modo intelligente il modello Gemini più appropriato per la tua query (Pro, Flash e così via) in base alle tue preferenze in termini di costo e qualità.
Per ulteriori informazioni sui prezzi di Model Optimizer, consulta Prezzi.
Vantaggi
Model Optimizer ti consente di:
- Semplifica la selezione del modello anziché scegliere un modello per ogni applicazione
- Ottimizzazione in base al costo, alla qualità o a entrambi, per bilanciare prestazioni e budget
- Integrazione perfetta con le API e gli SDK Gemini esistenti
- Monitorare l'utilizzo e identificare il potenziale per i risparmi sui costi
- Gestire in modo efficiente le attività basate su testo senza dover selezionare manualmente gli endpoint
Modelli supportati
- Gemini 2.0 Flash (GA)
- Gemini 2.5 Pro (anteprima, 25 marzo)
Supporto dei linguaggi
Model Optimizer supporta tutte le lingue supportate anche dai modelli Gemini. (vedi Supporto delle lingue di Gemini)
Modalità
Model Optimizer supporta i casi d'uso di testo, tra cui:
- Codifica, incluse chiamate di funzione ed esecuzione di codice
- Riassunto
- Chat a singolo e più turni
- Domanda e risposta
Per conoscere le limitazioni e come gestirle, consulta Gestire le funzionalità non supportate.
Per iniziare
Per iniziare a utilizzare Model Optimizer, consulta il nostro notebook di Colab di avvio rapido.
Utilizzo di Vertex AI Model Optimizer
Gen AI SDK for Python
Installa
pip install --upgrade google-genai
Per saperne di più, consulta la documentazione di riferimento dell'SDK.
Imposta le variabili di ambiente per utilizzare l'SDK Gen AI con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Gestione delle funzionalità non supportate
Model Optimizer supporta solo l'input e l'output di testo. Tuttavia, la richiesta potrebbe includere modalità o strumenti diversi non supportati. Le seguenti sezioni spiegano come Model Optimizer gestisce queste funzionalità non supportate.
Richieste multimodali
Le richieste che includono prompt con dati multimodali, come video, immagini o audio, generano un errore INVALID_ARGUMENT
.
Strumenti non supportati
Model Optimizer supporta solo la dichiarazione di funzione per le richieste. Se una richiesta contiene altri tipi di strumenti, tra cui google_maps
, google_search
, enterprise_web_search
, retrieval
o browse
, viene generato un errore INVALID_ARGUMENT
.
Invia feedback
Per inviare un feedback sulla tua esperienza con Model Optimizer, compila il nostro sondaggio di feedback.
Per domande, problemi tecnici o feedback su Model Optimizer, contatta model-optimizer-support@google.com.
Gruppo di discussione con i clienti
Per contattare direttamente il team di sviluppo, puoi partecipare al gruppo di ascolto di Vertex AI Model Optimizer, dove puoi scoprire di più sul prodotto e aiutarci a capire come migliorare il funzionamento delle funzionalità. Le attività del gruppo includono:
- Workshop virtuali per scoprire di più sulle funzionalità
- Sondaggi di feedback per condividere le tue esigenze e priorità
- Sessioni 1:1 con Google Cloud dipendenti per esplorare nuove funzionalità
Le attività vengono offerte circa una volta ogni 6-8 settimane. Puoi partecipare a un numero illimitato di iniziative o disattivare la funzionalità in qualsiasi momento. Per partecipare al gruppo, compila il modulo di registrazione al gruppo di discussione Vertex AI Model Optimizer.