Acquista throughput riservato

Questa pagina fornisce dettagli da considerare prima di abbonarti al throughput Provisioning, le autorizzazioni di cui devi disporre per effettuare o visualizzare un ordine di throughput Provisioning e le istruzioni per effettuare e visualizzare gli ordini.

Aspetti da considerare prima dell'acquisto

Per aiutarti a decidere se acquistare il throughput pianificato, tieni presente quanto segue:

  • Non puoi annullare l'ordine a metà del periodo di validità.

    L'acquisto del throughput riservato è un impegno, il che significa che non puoi annullare l'ordine a metà termine. Tuttavia, puoi aumentare il numero di GSU acquistate. Se acquisti per errore un impegno o si verifica un problema con la configurazione, contatta il rappresentante dell'Google Cloud account per ricevere assistenza.

  • Puoi attivare il rinnovo automatico dell'abbonamento.

    Quando invii l'ordine, puoi scegliere di rinnovare automaticamente l'abbonamento al termine del periodo di validità o di lasciarlo scadere. Puoi annullare la procedura di rinnovo automatico. Per annullare l'abbonamento prima del rinnovo automatico, annulla il rinnovo automatico 30 giorni prima dell'inizio del periodo successivo.

    Puoi configurare gli abbonamenti mensili in modo che si rinnovino automaticamente ogni mese. I termini settimanali non supportano il rinnovo automatico.

    Per ulteriori informazioni, vedi Modificare l'ordine di throughput provisionato. Puoi anche contattare il Google Cloud rappresentante dell'account per ricevere assistenza.

  • Puoi modificare il comportamento di rinnovo automatico, il modello, la versione del modello o la regione con preavviso.

    Dopo aver scelto il progetto, la regione, il modello, la versione del modello e il comportamento di rinnovo automatico e dopo che l'ordine è stato approvato e attivato, il throughput riservato viene attivato, in base alla capacità disponibile. Puoi modificare il comportamento di rinnovo automatico, il modello o la versione del modello utilizzando la console Google Cloud, che puoi utilizzare per modificare l'ordine esistente. Per maggiori informazioni, consulta Modificare l'ordine di throughput provisionato.

    Per modificare la regione, contatta il Google Cloud rappresentante del tuo account per ricevere assistenza. Potrebbe essere necessario un nuovo ordine con una nuova data di fine dell'abbonamento.

    Tutte le modifiche vengono elaborate secondo il criterio del "best effort" e in genere vengono completate entro 10 giorni lavorativi dalla richiesta iniziale.

    Le modifiche al modello sono limitate a un publisher specifico. Ad esempio, puoi cambiare l'assegnazione del modello di throughput pianificato da Google Gemini 2.0 Pro a Google Gemini 2.0 Flash, ma non puoi passare da Google Gemini 2.0 Flash a Claude 3.5 Sonnet v2 di Anthropic.

  • Per impostazione predefinita, l'utilizzo in eccesso viene fatturato con pagamento a consumo.

    Se la tua capacità supera l'importo dell'ordine di Throughput provisioned, le eccedenze vengono elaborate e fatturate come pagamento a consumo standard. Puoi controllare le eccedenze su base per richiesta. Per ulteriori informazioni, consulta la sezione Utilizzare il throughput pianificato.

Acquistare il throughput riservato per un periodo di una settimana

Anziché un abbonamento mensile, puoi acquistare il throughput Provisioning per un periodo di una settimana con la possibilità di indicare una data di inizio entro due settimane dal momento in cui effettui l'ordine dopo aver inviato il modulo di controllo dell'accesso al throughput Provisioning.

Per informazioni sui prezzi, consulta Throughput pianificato.

Ruoli e autorizzazioni

Il seguente ruolo concede l'accesso completo per gestire il throughput riservato di Vertex AI:

  • roles/aiplatform.provisionedThroughputAdmin: puoi accedere alle risorse di throughput riservato di Vertex AI.

Questo ruolo include le seguenti autorizzazioni:

Autorizzazioni Descrizione
aiplatform.googleapis.com/provisionedThroughputs.create Invia un nuovo ordine di throughput riservato.
aiplatform.googleapis.com/provisionedThroughputs.get Visualizza un ordine di throughput riservato specifico.
aiplatform.googleapis.com/provisionedThroughputs.list Visualizza tutti gli ordini di throughput riservato.
aiplatform.googleapis.com/provisionedThroughputs.update Modificare un ordine di throughput riservato.
aiplatform.googleapis.com/provisionedThroughputs.cancel Annullare un ordine o un aggiornamento in attesa.

Effettuare un ordine per la velocità effettiva di cui è stato eseguito il provisioning

Alcune funzionalità di Imagen potrebbero non essere disponibili pubblicamente. Per scoprire di più, consulta Funzionalità di Preview e GA con limitazioni.

Prima di effettuare un ordine per utilizzare MedLM-large-1.5, contatta il Google Cloud rappresentante del tuo account per richiedere accesso. Se prevedi che il QPM superi 30.000, per massimizzare l'ordine di Throughput riservato, richiedi un aumento della quota di sistema Vertex AI predefinita utilizzando le seguenti informazioni:

  • Servizio: l'API Vertex AI.
  • Nome: Online prediction requests per minute per region
  • Tipo di servizio: una quota.
  • Dimensioni: la regione in cui hai ordinato il Throughput riservato.
  • Valore: il limite di traffico di previsione online che hai scelto.

Gli ordini di throughput riservato vengono elaborati in base alle dimensioni dell'ordine e alla capacità disponibile. A seconda del numero di GSU richiesti e della capacità disponibile, l'elaborazione dell'ordine potrebbe richiedere da alcuni minuti a diverse settimane.

Per acquistare il throughput pianificato:

Console

  1. Nella console Google Cloud, vai alla pagina Throughput pianificato.

    Vai a Throughput riservato

  2. Per avviare un nuovo ordine, fai clic su Nuovo ordine.
  3. Inserisci un nome ordine.
  4. Seleziona Modello.
  5. Seleziona la Regione.
  6. Inserisci il numero di unità della scala di AI generativa (GSU) che devi acquistare.

    (Facoltativo) Puoi utilizzare lo strumento per la stima di unità della scala di AI generativa per stimare il numero di GSU di cui avrai bisogno. Per utilizzare questo strumento:

    1. Fai clic su Strumento di stima.
    2. Seleziona il tuo modello.
    3. In base al modello selezionato, inserisci i dettagli per stimare il numero di unità di servizio generiche necessarie.

      • Per i modelli Gemini 2.0, inserisci quanto segue:

        • Query al secondo stimate che richiedono la verifica
        • Token di input per query
        • Token immagine di input per query
        • Token video di input per query
        • Token audio di input per query
        • Token di testo di output per query
      • Per i modelli Imagen, inserisci quanto segue:

        • Query al secondo
        • Immagini di output per query
    4. Se vuoi utilizzare i valori inseriti nello strumento di stima, fai clic su Utilizza calcolato.

  7. Seleziona il Termine. Sono disponibili le seguenti opzioni:

    • 1 settimana (disponibile in Anteprima privata)
    • 1 mese
    • 3 mesi
    • 1 anno
  8. (Facoltativo) Seleziona la data e l'ora di inizio del periodo (anteprima).

    Puoi fornire una data e un'ora di inizio entro due settimane dal momento in cui effettui l'ordine. Se non specifichi una data e un'ora di inizio, l'ordine viene elaborato non appena la capacità è disponibile. Le date e gli orari di inizio richiesti vengono elaborati secondo il criterio del "best effort" e non è garantito che gli ordini vengano completati entro queste date fino a quando lo stato dell'ordine non viene impostato su Approvato.

    Se la data di inizio richiesta è troppo vicina alla data corrente, l'ordine potrebbe essere approvato e attivato dopo la data di inizio richiesta. In questo caso, la data di fine viene modificata in base alla durata del termine selezionato, a partire dalla data di attivazione. Per informazioni su come annullare un ordine in attesa, vedi Modificare l'ordine di throughput provisionato.

  9. Nell'elenco Rinnovo, specifica se vuoi rinnovare automaticamente l'ordine al termine del periodo. Puoi specificare l'opzione di rinnovo solo se selezioni 1 mese, 3 mesi o 1 anno come periodo.

  10. Fai clic su Continua.

  11. Nella sezione Riepilogo, controlla le stime di prezzo e throughput per il tuo ordine. Leggi i termini elencati e collegati nel modulo.

  12. Per finalizzare l'ordine, fai clic su Conferma.

    L'elaborazione di un ordine può richiedere da alcuni minuti a diverse settimane, a seconda delle dimensioni dell'ordine e della capacità disponibile. Una volta elaborato, lo stato dell'ordine nella console Google Cloud diventa Attivo. Ti verrà addebitato l'ordine solo dopo che sarà diventato attivo.

Modificare l'ordine del throughput riservato

Questa tabella descrive come puoi modificare gli ordini di throughput Provisioning tramite la console Google Cloud in base allo stato dell'ordine e alle eventuali condizioni esistenti. La modifica degli ordini è una funzionalità di anteprima ed è disponibile solo per gli ordini online effettuati tramite la console. Per le modifiche agli ordini offline, contatta il tuo Google Cloud rappresentante dell'account per ricevere assistenza.

Inoltre, le modifiche apportate al modello o alla versione del modello quando utilizzi la console Google Cloud modificano l'ordine esistente mantenendo la stessa data di fine dell'abbonamento.

Stato dell'ordine Azione Nota Passaggi nella console Google Cloud
In attesa di revisione Puoi annullare l'ordine.

Se devi apportare ulteriori modifiche all'ordine, annulla l'ordine in attesa ed effettuane uno nuovo.

Se hai più modelli, ogni modello può avere una sola revisione dell'ordine o un solo ordine in attesa alla volta.

Per annullare l'ordine in attesa nella console Google Cloud:
  1. Vai alla pagina Throughput riservato.
  2. Seleziona la regione in cui si trova l'ordine in attesa.
  3. Per andare alla pagina Dettagli ordine, fai clic sull'ID ordine dell'ordine che vuoi annullare.
  4. Fai clic su Annulla.
  5. Nella finestra di dialogo Vuoi annullare l'ordine?, fai clic su Annulla ordine.
Attivo

Puoi aumentare le GSU per gli ordini esistenti.

Puoi attivare o disattivare i rinnovi automatici.

Puoi modificare il modello o la versione del modello.

Se entrambe queste condizioni sono soddisfatte, non puoi modificare l'ordine:
  • Mancano meno di 5 giorni alla data di scadenza dell'ordine.
  • Il rinnovo automatico dell'ordine non è impostato.
Per modificare l'ordine attivo nella console Google Cloud, utilizza uno dei seguenti metodi:
  • Nella pagina Throughput pianificato, fai clic sul simbolo nella colonna Azioni e poi su Modifica.
  • Nella pagina Dettagli ordine, fai clic sul pulsante Modifica.

Verifica lo stato dell'ordine

Dopo aver inviato l'ordine di throughput provisionato, lo stato dell'ordine potrebbe essere uno dei seguenti:

  • In attesa di revisione: hai effettuato l'ordine. Poiché l'approvazione dipende dalla capacità disponibile per il provisioning dell'ordine, l'ordine è in attesa di revisione e approvazione. Per ulteriori informazioni sullo stato dell'ordine in attesa, contatta il rappresentante Google Cloud dell'account.
  • Approvato: Google ha approvato il tuo ordine.
  • Attivo: Google ha attivato l'ordine e la fatturazione ha inizio.
  • Scaduto: il tuo ordine è scaduto.

Visualizzare gli ordini di throughput riservato

Per visualizzare gli ordini di throughput Provisioning:

Console

  1. Nella console Google Cloud, vai alla pagina Throughput pianificato.

    Vai a Throughput riservato

  2. Seleziona la Regione. Viene visualizzato l'elenco degli ordini.

Passaggi successivi