Resumen de las opciones de entrenamiento personalizado en Vertex AI

Comparar el entrenamiento personalizado de Vertex AI y Ray en Vertex AI

Vertex AI ofrece dos opciones para el entrenamiento personalizado: Vertex AI Custom Training y Ray en Vertex AI. En esta página se ofrece contexto para ayudarte a elegir entre estas dos opciones.

Vertex AI Training Ray en Vertex AI
Enfocar Entrenamiento de modelos personalizados de uso general. Escalar aplicaciones de IA y Python, incluido el entrenamiento de modelos, las aplicaciones distribuidas y el servicio de modelos.
Framework subyacente Es compatible con varios frameworks de aprendizaje automático, como TensorFlow, PyTorch y scikit-learn. Aprovecha el framework de código abierto Ray. Es compatible con varios frameworks: TensorFlow, PyTorch, scikit-learn y Spark en Ray (con RayDP).
Flexibilidad Gran flexibilidad en cuanto al código y al entorno. Gran flexibilidad para crear aplicaciones distribuidas. Puedes usar el código de Ray con cambios mínimos.
Escalabilidad Admite el entrenamiento distribuido en varias máquinas. Ofrece recursos de computación escalables (CPUs, GPUs y TPUs). Diseñado para ofrecer una alta escalabilidad mediante las funciones de computación distribuida de Ray (hasta 2000 nodos). Admite el escalado manual y automático.
Integración Integrado con otros servicios de Vertex AI (conjuntos de datos, Vertex AI Experiments y más). Se integra con otros Google Cloud servicios, como Vertex AI Inference y BigQuery.
Facilidad de uso Es más fácil de usar en paradigmas de entrenamiento distribuido estándar. Se requiere familiaridad con los conceptos del framework Ray.
Entorno Entorno gestionado para ejecutar código de entrenamiento personalizado con contenedores precompilados o personalizados. Entorno gestionado para ejecutar aplicaciones distribuidas mediante el framework Ray. Simplifica la gestión del clúster de Ray en Vertex AI.
Ajuste de hiperparámetros Incluye funciones de ajuste de hiperparámetros. Simplifica el ajuste de hiperparámetros con herramientas para optimizar y gestionar experimentos de forma eficiente.
Flujos de procesamiento de entrenamiento Admite flujos de trabajo de aprendizaje automático complejos con varios pasos. No aplicable

Diferencias clave entre el entrenamiento personalizado de Vertex AI y Ray en Vertex AI

El entrenamiento personalizado de Vertex AI es un servicio más amplio que gestiona varios métodos de entrenamiento, mientras que Ray en Vertex AI usa específicamente el framework de computación distribuida de Ray.

Vertex AI Training Ray en Vertex AI
Enfocar Se centra principalmente en el desarrollo y el entrenamiento de modelos. Gestiona varios métodos de entrenamiento. Diseñado para aplicaciones Python distribuidas de uso general, como el procesamiento de datos, el servicio de modelos y el escalado del entrenamiento.
Framework subyacente Vinculado a las funciones distribuidas de frameworks de aprendizaje automático específicos (por ejemplo, TensorFlow o PyTorch). Usa Ray como marco de computación distribuida central. Gestiona la distribución de tareas independientemente del framework de aprendizaje automático subyacente que se utilice en las tareas de Ray.
Configuración de recursos Configura los recursos de las tareas de entrenamiento individuales. Gestionar clústeres de Ray en clústeres de Vertex AI. Ray se encarga de distribuir las tareas en el clúster.
Configuración de la distribución Configura el número y los tipos de réplicas de una tarea de entrenamiento específica. Configura el tamaño y la composición del clúster de Ray en Vertex AI. El programador de Ray distribuye dinámicamente las tareas y los actores entre los nodos disponibles.
Ámbito de distribución Por lo general, se centra en una sola tarea de entrenamiento que puede durar mucho tiempo. Proporciona un entorno de computación distribuida más persistente y de uso general en el que puedes ejecutar varias tareas y aplicaciones distribuidas durante el ciclo de vida del clúster de Ray.

Resumen

Si necesitas usar la potencia de la computación distribuida con el framework Ray en el entorno de Google Cloud , Ray en Vertex AI es el servicio que debes usar. Ray en Vertex AI se puede considerar una herramienta específica dentro del ecosistema de Vertex AI, especialmente útil para cargas de trabajo distribuidas y altamente escalables.

Si necesitas una plataforma gestionada más general para varios enfoques de entrenamiento de modelos, incluidas opciones automatizadas, ejecución de código personalizado y ajuste de hiperparámetros, te serán útiles los servicios de entrenamiento personalizado de Vertex AI.