Cosa considerare prima dell'acquisto
Per aiutarti a decidere se acquistare il throughput di cui è stato eseguito il provisioning, considera quanto segue:
Non puoi annullare l'ordine a metà del periodo di validità.
L'acquisto del throughput riservato è un impegno, il che significa che non puoi annullare l'ordine a metà del periodo. Tuttavia, puoi aumentare il numero di GSU acquistate. Se acquisti per errore un impegno o se si verifica un problema con la configurazione, contatta il tuo Google Cloud rappresentante dell'account per ricevere assistenza.
Puoi rinnovare automaticamente il tuo abbonamento.
Quando invii l'ordine, puoi scegliere di rinnovare automaticamente l'abbonamento al termine del periodo di validità o di lasciarlo scadere. Puoi annullare la procedura di rinnovo automatico. Per annullare l'abbonamento prima del rinnovo automatico, annulla il rinnovo automatico 30 giorni prima dell'inizio del periodo successivo.
Puoi configurare gli abbonamenti mensili in modo che si rinnovino automaticamente ogni mese. I termini settimanali non supportano il rinnovo automatico.
Per saperne di più, vedi Modificare l'ordine di throughput di cui è stato eseguito il provisioning. Puoi anche contattare il tuo Google Cloud rappresentante dell'account per ricevere assistenza.
Puoi modificare il comportamento, il modello, la versione del modello o la regione del rinnovo automatico con preavviso.
Dopo aver scelto il progetto, la regione, il modello, la versione del modello e il comportamento di rinnovo automatico e dopo che l'ordine è stato approvato e attivato, il throughput riservato viene attivato, in base alla capacità disponibile. Puoi modificare il comportamento di rinnovo automatico, il modello, la versione del modello o la regione modificando l'ordine di Provisioned Throughput esistente utilizzando la console Google Cloud .
Tutte le modifiche vengono elaborate secondo il criterio del "best effort" e in genere vengono completate entro 10 giorni lavorativi dalla richiesta iniziale.
Le modifiche al modello sono limitate a un editore specifico. Ad esempio, puoi cambiare l'assegnazione del modello di Provisioned Throughput da Google Gemini 2.0 Pro a Google Gemini 2.0 Flash, ma non puoi passare da Google Gemini 2.0 Flash a Claude 3.5 Sonnet v2 di Anthropic.
Per impostazione predefinita, l'eccedenza viene fatturata in base al pagamento a consumo.
Se la velocità effettiva supera l'importo dell'ordine di velocità effettiva di cui è stato eseguito il provisioning, le eccedenze vengono elaborate e fatturate in base al pagamento a consumo standard. Puoi controllare le eccedenze in base alle singole richieste. Per ulteriori informazioni, consulta la sezione Utilizzare la velocità effettiva di provisioning.
Per informazioni sui prezzi, consulta la sezione Throughput di cui è stato eseguito il provisioning.
Acquistare il throughput riservato per i modelli in anteprima
Puoi acquistare il throughput di cui è stato eseguito il provisioning per i modelli Google in anteprima, a condizione che non sia stata rilasciata una versione disponibile a livello generale del modello.
Se hai un ordine di throughput riservato attivo per un modello in anteprima e viene rilasciata una versione del modello disponibile a livello generale, puoi:
Sposta l'ordine nella versione del modello disponibile a livello generale. Tieni presente che dopo aver spostato l'ordine sul modello disponibile a livello generale, non puoi tornare al modello di anteprima. Per ulteriori informazioni sulla modifica di un ordine, vedi Modificare l'ordine di throughput di cui è stato eseguito il provisioning.
In alternativa, continua a utilizzare il throughput riservato per la versione di anteprima di un modello finché la versione di anteprima è stabile. Per ulteriori informazioni sui modelli stabili e ritirati, consulta Versioni e ciclo di vita dei modelli.
Ruoli e autorizzazioni
Il seguente ruolo concede l'accesso completo per gestire il throughput riservato di Vertex AI:
roles/aiplatform.provisionedThroughputAdmin
: puoi accedere alle risorse di throughput riservato di Vertex AI.
Questo ruolo include le seguenti autorizzazioni:
Autorizzazioni | Descrizione |
---|---|
aiplatform.googleapis.com/provisionedThroughputs.create |
Invia un nuovo ordine di Provisioned Throughput. |
aiplatform.googleapis.com/provisionedThroughputs.get |
Visualizza un ordine di throughput riservato specifico. |
aiplatform.googleapis.com/provisionedThroughputs.list |
Visualizza tutti gli ordini di throughput riservato. |
aiplatform.googleapis.com/provisionedThroughputs.update |
Modifica un ordine di Provisioned Throughput. |
aiplatform.googleapis.com/provisionedThroughputs.cancel |
Annullare un ordine in attesa o un aggiornamento in attesa. |
Effettuare un ordine di velocità effettiva di cui è stato eseguito il provisioning
Alcune funzionalità di Imagen potrebbero non essere disponibili pubblicamente. Per saperne di più, consulta Funzionalità GA e anteprima con limitazioni.
Prima di effettuare un ordine per utilizzare MedLM-large-1.5, contatta il tuo Google Cloud account representative per richiedere l'accesso.
Se prevedi che il QPM superi 30.000, per massimizzare l'ordine di throughput riservato, richiedi una modifica della quota per la quota di sistema Vertex AI predefinita utilizzando le seguenti informazioni:
- Servizio: l'API Vertex AI.
- Nome:
Online prediction requests per minute per region
- Tipo di servizio: una quota.
- Dimensioni: la regione in cui hai ordinato il Throughput riservato.
- Valore: questo è il limite di traffico di previsione online che hai scelto.
Gli ordini di throughput riservato vengono elaborati in base alle dimensioni dell'ordine e alla capacità disponibile. A seconda del numero di GSU richieste e della capacità disponibile, l'elaborazione dell'ordine potrebbe richiedere da pochi minuti a qualche settimana.
Segui questi passaggi per acquistare il throughput di cui è stato eseguito il provisioning:
Console
- Nella console Google Cloud , vai alla pagina Provisioned Throughput (Throughput di cui è stato eseguito il provisioning).
- Per avviare un nuovo ordine, fai clic su Nuovo ordine.
- Inserisci un nome ordine.
- Seleziona il modello.
- Seleziona la regione.
Inserisci il numero di unità della scala di AI generativa (GSU) che devi acquistare.
(Facoltativo) Puoi utilizzare lo strumento per la stima di unità della scala di AI generativa per stimare il numero di GSU di cui avrai bisogno. Per utilizzare questo strumento:
- Fai clic su Strumento di stima.
- Seleziona il tuo modello.
In base al modello selezionato, inserisci i dettagli per stimare il numero di GSU necessari.
Per i modelli Gemini 2.5, inserisci quanto segue:
- Query al secondo stimate che richiedono la verifica
- Token di testo di input per query
- Token immagine di input per query
- Token video di input per query
- Token audio di input per query
- Token di testo per risposta di output per query
- Token di testo per ragionamento di output per query
Per il modello Gemini 2.5 Flash-Lite (anteprima), inserisci quanto segue:
- Query al secondo stimate che richiedono la verifica
- Token di testo di input per query
- Token immagine di input per query
- Token video di input per query
- Token audio di input per query
- Token di testo di output per query
Per i modelli Gemini 2.0, inserisci quanto segue:
- Query al secondo stimate che richiedono la verifica
- Token di input per query
- Token immagine di input per query
- Token video di input per query
- Token audio di input per query
- Token di testo di output per query
Per i modelli Imagen, inserisci quanto segue:
- Query al secondo
- Immagini di output per query
Se vuoi utilizzare i valori inseriti nello strumento di stima, fai clic su Usa calcolato.
Seleziona il Termine. Tieni presente che le tariffe del periodo non sono annullabili per la durata del periodo e verranno addebitate a prescindere dall'uso effettivo o se il modello non è più disponibile. Google consiglia di modificare il modello assegnato prima della data di fine della disponibilità. Google non annullerà in modo proattivo il rinnovo automatico per i modelli non più disponibili.
Sono disponibili le seguenti opzioni:
- 1 settimana
- 1 mese
- 3 mesi
- 1 anno
(Facoltativo) Seleziona la data e l'ora di inizio del periodo (anteprima).
Puoi fornire una data e un'ora di inizio entro due settimane dalla data in cui effettui l'ordine. Se non specifichi una data e un'ora di inizio, l'ordine viene elaborato non appena la capacità è disponibile. Le date e gli orari di inizio richiesti vengono elaborati secondo il criterio del "best effort" e non è garantito che gli ordini vengano completati entro queste date fino a quando lo stato dell'ordine non viene impostato su Approvato.
Se la data di inizio richiesta è troppo vicina alla data corrente, l'ordine potrebbe essere approvato e attivato dopo la data di inizio richiesta. In questo caso, la data di fine viene modificata in base alla durata del periodo selezionato, a partire dalla data di attivazione. Per informazioni sull'annullamento di un ordine in attesa, vedi Modificare l'ordine di Provisioned Throughput.
Nell'elenco Rinnovo, specifica se vuoi rinnovare automaticamente l'ordine al termine del periodo. Puoi specificare l'opzione di rinnovo solo se selezioni 1 mese, 3 mesi o 1 anno come durata.
Fai clic su Continua.
Nella sezione Riepilogo, esamina le stime del prezzo e del throughput per il tuo ordine. Leggi i termini elencati e collegati nel modulo.
Per finalizzare l'ordine, fai clic su Conferma.
L'elaborazione di un ordine può richiedere da pochi minuti a qualche settimana, a seconda delle dimensioni dell'ordine e della capacità disponibile. Una volta elaborato l'ordine, il relativo stato nella console Google Cloud diventa Attivo. L'ordine ti viene addebitato solo dopo l'attivazione.
Modificare l'ordine di throughput riservato
Questa tabella descrive come modificare gli ordini di throughput di cui è stato eseguito il provisioning tramite la consoleGoogle Cloud in base allo stato dell'ordine e alle condizioni esistenti. La modifica degli ordini è una funzionalità di anteprima ed è disponibile solo per gli ordini online effettuati tramite la console. Per le modifiche agli ordini offline, contatta il tuo Google Cloud account representative per ricevere assistenza.
Inoltre, le modifiche apportate al modello o alla versione del modello quando utilizzi la console Google Cloud modificano l'ordine esistente mantenendo la stessa data di fine abbonamento.
Stato dell'ordine | Azione | Nota | Passaggi nella console Google Cloud |
---|---|---|---|
In attesa di revisione | Puoi annullare l'ordine. |
Se devi apportare ulteriori modifiche all'ordine, annulla l'ordine in attesa ed effettua un nuovo ordine. Se hai più modelli, ogni modello può avere una sola revisione dell'ordine o un solo ordine in attesa alla volta. |
Per annullare l'ordine in attesa nella console Google Cloud , procedi nel seguente modo:
|
Approvato | Non puoi modificare l'ordine. | L'ordine è in attesa di attivazione. Al momento non puoi apportare modifiche all'ordine. | Non applicabile |
Attivo |
Puoi apportare le seguenti modifiche solo se l'ordine non scade nei cinque giorni successivi o si rinnova automaticamente:
|
Non puoi modificare un ordine attivo se scade in meno di cinque giorni e non è configurato per il rinnovo automatico. | Per modificare l'ordine attivo nella console Google Cloud , utilizza uno dei seguenti metodi:
|
Verifica lo stato dell'ordine
Dopo aver inviato l'ordine di throughput di cui è stato eseguito il provisioning, lo stato dell'ordine potrebbe essere uno dei seguenti:
- In attesa di revisione: hai effettuato l'ordine. Poiché l'approvazione dipende dalla capacità disponibile per il provisioning dell'ordine, quest'ultimo è in attesa di revisione e approvazione. Per ulteriori informazioni sullo stato dell'ordine in attesa, contatta il rappresentante dell'account. Google Cloud
- Approvato: Google ha approvato l'ordine, che è in attesa di attivazione. Non puoi apportare modifiche dopo l'approvazione dell'ordine.
- Attivo: Google ha attivato l'ordine e la fatturazione ha inizio.
- Scaduto: il tuo ordine è scaduto.
Visualizzare gli ordini di throughput riservato
Per visualizzare gli ordini di Provisioned Throughput:
Console
- Nella console Google Cloud , vai alla pagina Provisioned Throughput (Throughput di cui è stato eseguito il provisioning).
- Seleziona la regione. Viene visualizzato l'elenco degli ordini.