Utilizzare i modelli Hugging Face

HuggingFace fornisce modelli preaddestrati, script di ottimizzazione fine e API di sviluppo che semplificano il processo di creazione e scoperta degli LLM. Model Garden può pubblicare i modelli supportati in HuggingFace di Iperduzione di embedding di testo, Iperduzione di PyTorch standard e Iperduzione di generazione di testo.

Opzioni di deployment per i modelli Hugging Face

Puoi eseguire il deployment dei modelli Hugging Face supportati in Vertex AI o Google Kubernetes Engine (GKE). L'opzione di deployment che scegli può dipendere dal modello in uso e dal livello di controllo che vuoi avere sui tuoi workload.

Esegui il deployment in Vertex AI

Vertex AI offre una piattaforma gestita per la creazione e la scalabilità dei progetti di machine learning senza competenze MLOps interne. Puoi utilizzare Vertex AI come applicazione a valle che pubblica i modelli Hugging Face. Ti consigliamo di utilizzare Vertex AI se vuoi funzionalità MLOps end-to-end, funzionalità di ML con valore aggiunto e un'esperienza serverless per uno sviluppo semplificato.

  1. Per eseguire il deployment di un modello Hugging Face supportato in Vertex AI, vai a Model Garden.

    Vai a Model Garden

  2. Vai alla sezione Modelli open source su Hugging Face e fai clic su Mostra altro.

  3. Trova e seleziona un modello da implementare.

  4. (Facoltativo) Per l'ambiente di deployment, seleziona Vertex AI.

  5. (Facoltativo) Specifica i dettagli del deployment.

  6. Fai clic su Esegui il deployment.

Per iniziare, consulta i seguenti esempi:

Esegui il deployment in GKE

Google Kubernetes Engine (GKE) è la Google Cloud soluzione per Kubernetes gestito che offre scalabilità, sicurezza, resilienza e costi effettivi. Ti consigliamo questa opzione se hai già effettuato investimenti in Kubernetes, se la tua organizzazione dispone di competenze MLOps interne o se hai bisogno di un controllo granulare su carichi di lavoro di IA/ML complessi con requisiti unici di sicurezza, pipeline di dati e gestione delle risorse.

  1. Per eseguire il deployment di un modello Hugging Face supportato in GKE, vai a Model Garden.

    Vai a Model Garden

  2. Vai alla sezione Modelli open source su Hugging Face e fai clic su Mostra altro.

  3. Trova e seleziona un modello da implementare.

  4. Per Ambiente di deployment, seleziona GKE.

  5. Segui le istruzioni di implementazione.

Per iniziare, consulta i seguenti esempi: