Vertex AI Model Optimizer

Vertex AI Model Optimizer è un endpoint dinamico progettato per semplificare la selezione del modello applicando automaticamente il modello Gemini più adatto alle tue esigenze. In questo modo puoi indirizzare i prompt a un singolo meta-endpoint e il servizio selezionerà in modo intelligente il modello Gemini più appropriato per la tua query (Pro, Flash e così via) in base alle tue preferenze in termini di costo e qualità.

Per ulteriori informazioni sui prezzi di Model Optimizer, consulta Prezzi.

Vantaggi

Model Optimizer ti consente di:

  • Semplifica la selezione del modello anziché scegliere un modello per ogni applicazione
  • Ottimizzazione in base al costo, alla qualità o a entrambi, per bilanciare prestazioni e budget
  • Integrazione perfetta con le API e gli SDK Gemini esistenti
  • Monitorare l'utilizzo e identificare il potenziale per i risparmi sui costi
  • Gestire in modo efficiente le attività basate su testo senza dover selezionare manualmente gli endpoint

Modelli supportati

  • Gemini 2.0 Flash (GA)
  • Gemini 2.5 Pro (anteprima, 25 marzo)

Supporto dei linguaggi

Model Optimizer supporta tutte le lingue supportate anche dai modelli Gemini. (vedi Supporto delle lingue di Gemini)

Modalità

Model Optimizer supporta i casi d'uso di testo, tra cui:

  • Codifica, incluse chiamate di funzione ed esecuzione di codice
  • Riassunto
  • Chat a singolo e più turni
  • Domanda e risposta

Per conoscere le limitazioni e come gestirle, consulta Gestire le funzionalità non supportate.

Per iniziare

Per iniziare a utilizzare Model Optimizer, consulta il nostro notebook di Colab di avvio rapido.

Utilizzo di Vertex AI Model Optimizer

Gen AI SDK for Python

Installa

pip install --upgrade google-genai

Per saperne di più, consulta la documentazione di riferimento dell'SDK.

Imposta le variabili di ambiente per utilizzare l'SDK Gen AI con Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import (
    FeatureSelectionPreference,
    GenerateContentConfig,
    HttpOptions,
    ModelSelectionConfig
)

client = genai.Client(http_options=HttpOptions(api_version="v1beta1"))
response = client.models.generate_content(
    model="model-optimizer-exp-04-09",
    contents="How does AI work?",
    config=GenerateContentConfig(
        model_selection_config=ModelSelectionConfig(
            feature_selection_preference=FeatureSelectionPreference.BALANCED  # Options: PRIORITIZE_QUALITY, BALANCED, PRIORITIZE_COST
        ),
    ),
)
print(response.text)
# Example response:
# Okay, let's break down how AI works. It's a broad field, so I'll focus on the ...
#
# Here's a simplified overview:
# ...

Gestione delle funzionalità non supportate

Model Optimizer supporta solo l'input e l'output di testo. Tuttavia, la richiesta potrebbe includere modalità o strumenti diversi non supportati. Le seguenti sezioni spiegano come Model Optimizer gestisce queste funzionalità non supportate.

Richieste multimodali

Le richieste che includono prompt con dati multimodali, come video, immagini o audio, generano un errore INVALID_ARGUMENT.

Strumenti non supportati

Model Optimizer supporta solo la dichiarazione di funzione per le richieste. Se una richiesta contiene altri tipi di strumenti, tra cui google_maps, google_search, enterprise_web_search, retrieval o browse, viene generato un errore INVALID_ARGUMENT.

Invia feedback

Per inviare un feedback sulla tua esperienza con Model Optimizer, compila il nostro sondaggio di feedback.

Per domande, problemi tecnici o feedback su Model Optimizer, contatta model-optimizer-support@google.com.

Gruppo di discussione con i clienti

Per contattare direttamente il team di sviluppo, puoi partecipare al gruppo di ascolto di Vertex AI Model Optimizer, dove puoi scoprire di più sul prodotto e aiutarci a capire come migliorare il funzionamento delle funzionalità. Le attività del gruppo includono:

  • Workshop virtuali per scoprire di più sulle funzionalità
  • Sondaggi di feedback per condividere le tue esigenze e priorità
  • Sessioni 1:1 con Google Cloud dipendenti per esplorare nuove funzionalità

Le attività vengono offerte circa una volta ogni 6-8 settimane. Puoi partecipare a un numero illimitato di iniziative o disattivare la funzionalità in qualsiasi momento. Per partecipare al gruppo, compila il modulo di registrazione al gruppo di discussione Vertex AI Model Optimizer.