Panoramica della risorsa permanente

Una risorsa permanente di Vertex AI è un cluster di lunga durata che puoi creare per eseguire job di addestramento personalizzato. Al termine di un job di addestramento, la risorsa permanente rimane disponibile per l'esecuzione di altri job di addestramento finché non la elimini. Puoi utilizzare una risorsa permanente per garantire la disponibilità delle risorse di calcolo e ridurre il tempo di avvio del job altrimenti necessario per la creazione delle risorse di calcolo. Le risorse permanenti supportano tutte le VM e le GPU supportate dai job di addestramento personalizzati. Questa pagina spiega quando utilizzare una risorsa permanente e fornisce informazioni su fatturazione e quota.

Quando utilizzare una risorsa persistente

Ti consigliamo di utilizzare le risorse permanenti nei seguenti scenari:

  • Vuoi garantire la disponibilità della capacità per i carichi di lavoro ML critici o durante le stagioni di picco. A differenza dei job personalizzati, in cui il servizio di addestramento rilascia la risorsa al termine del job, la risorsa permanente rimane disponibile fino a quando non viene eliminata.
  • Invii lo stesso job più volte e puoi trarre vantaggio dalla memorizzazione nella cache dei dati e delle immagini eseguendo i job sulla stessa risorsa persistente.
  • Esegui molti job di addestramento di breve durata in cui il tempo di addestramento effettivo è inferiore al tempo di avvio del job.

Per ulteriori informazioni su quando e perché utilizzare una risorsa persistente, consulta il post del blog Garantire la capacità e tempi di avvio più rapidi per Vertex AI Training.

Dettagli di fatturazione

Ti vengono addebitati i costi per l'intera durata in cui una risorsa permanente è in stato di esecuzione, indipendentemente dal fatto che sia in esecuzione un job sulla risorsa permanente. Per ogni istanza nel pool di risorse permanenti, ti viene addebitato un importo per ogni ora di core. Tutti i job in esecuzione su una risorsa permanente non vengono addebitati separatamente. Ti viene addebitato solo il costo della risorsa permanente.

Se configuri la scalabilità automatica per la risorsa permanente, paghi solo per le istanze di cui è stato eseguito il provisioning. Ad esempio, se min-replica-count è impostato su 4, viene eseguito sempre il provisioning di 4 istanze e questo è l'importo minimo che ti viene addebitato. Quando il carico di lavoro aumenta, il pool di risorse potrebbe aumentare fino a 6 per soddisfare la domanda in crescita. Dopodiché, ti verranno addebitate le istanze di cui è stato eseguito il provisioning per 6finché il pool di risorse non verrà ridotto di nuovo. Per evitare di pagare per i nodi inattivi, utilizza la scalabilità automatica per la risorsa permanente o eliminala quando non ne hai più bisogno. Per saperne di più sui prezzi, consulta la sezione Modelli con addestramento personalizzato nella pagina dei prezzi di Vertex AI.

Quote

Le risorse permanenti utilizzano la quota di addestramento, quindi verifica di avere una quota sufficiente per la creazione di risorse permanenti. Per scoprire di più sulle quote, consulta Quote e limiti per la formazione.

Passaggi successivi