Ejecuta cargas de trabajo de IA/AA optimizadas con las funciones de organización de la plataforma Google Kubernetes Engine (GKE). Con Google Kubernetes Engine (GKE), puedes implementar una plataforma de IA y AA sólida y lista para la producción con todos los beneficios de Kubernetes administrado y estas capacidades:

  • Organización de infraestructura que admite GPU y TPU para el entrenamiento y la entrega de cargas de trabajo a gran escala
  • Integración flexible en frameworks de procesamiento distribuido y procesamiento de datos.
  • Compatibilidad con varios equipos en la misma infraestructura a fin de maximizar el uso de los recursos
En esta página, se proporciona una descripción general de las capacidades de IA/AA de GKE y cómo comenzar a ejecutar cargas de trabajo de IA/AA optimizadas en GKE con GPUs, TPU y frameworks como TGI de Hugging Face, vLLM y JetStream.

Recursos de documentación

Encuentra guías de inicio rápido y otras guías, revisa las referencias clave y obtén ayuda con problemas habituales.
Explora la capacitación de autoaprendizaje de Google Cloud Skills Boost, casos de uso, arquitecturas de referencia y muestras de código con ejemplos de cómo usar y conectar los servicios de Google Cloud.

Videos relacionados