Tutoriels

Les grands modèles de langage

Mettre en service un LLM à l'aide de TPU sur GKE avec vLLM

Guide d'utilisation de vLLM pour mettre en service des grands modèles de langage (LLM) à l'aide de Tensor Processing Units (TPU) sur Google Kubernetes Engine (GKE).

Modèles de diffusion

Inférence MaxDiffusion sur v6e

Guide de configuration et d'utilisation de MaxDiffusion pour l'inférence sur v6e.

Classification d'images

Entraîner ResNet sur Cloud TPU (PyTorch)

Modèle de classification d'images ResNet utilisant PyTorch, optimisé pour fonctionner sur Cloud TPU.

Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.

Tutoriels

Mettre en service un LLM à l'aide de TPU sur GKE avec vLLM

Inférence MaxDiffusion sur v6e

Entraîner ResNet sur Cloud TPU (PyTorch)