Costo de crear y, luego, implementar modelos de IA en Vertex AI

Los precios aparecen en dólares estadounidenses (USD). Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en SKU de Google Cloud.

Solo se te cobrará por las solicitudes que devuelvan un código de respuesta 200. Las solicitudes que devuelven otros códigos de respuesta, como los códigos 4xx y 5xx, no se cobran por la entrada ni la salida.

En esta página, se abordan los precios de la asistencia de IA generativa en Vertex AI. Para obtener información sobre todos los demás precios de Vertex AI, incluidos los servicios de ML Platform y MLOps, consulta la página de precios de Vertex AI.

Modelos de Google

Gemini 2.5

Modelo Tipo Precio (/1 millón de tokens) <= 200,000 tokens de entrada Precio (/1M tokens) > 200,000 tokens de entrada Precio (/1M tokens) <= 200K tokens de entrada con la API por lotes Precio (/1M tokens) > 200,000 tokens de entrada con la API por lotes
Gemini 2.5 Pro
Entrada (texto, imagen, video, audio) USD 1.25 USD 2.5 $0.625 USD 1.25
Salida de texto (respuesta y razonamiento) $10 $15 $5 USD 7.5


Gemini 2.5
Flash GA
Entrada (texto, imagen, video) $0.30 $0.30 $0.15 $0.15
Entrada de audio $1 $1 $0.5 $0.5
Salida de texto $2.50 $2.50 USD 1.25 USD 1.25
Ajuste para 1 millón de tokens de entrenamiento $5.00 N/A N/A N/A




Versión preliminar de Gemini 2.5 Flash
(Los extremos se retiraron el 15/7/2025)
Entrada (texto, imagen, video) $0.15 $0.15 $0.075 $0.075
Entrada de audio $1 $1 $0.5 $0.5
Salida de texto (sin pensar) $0.60 $0.60 $0.30 $0.30
Salida de texto (respuesta de pensamiento y razonamiento) $3.50 $3.50 $1.75 $1.75




API de Gemini 2.5 Flash Live
1 millón de tokens de texto de entrada $0.5 $0.5 N/A N/A
1 millón de tokens de entrada de audio $3 $3 N/A N/A
1 millón de tokens de video de entrada $3 $3 N/A N/A
1 millón de tokens de texto de salida $2 $2 N/A N/A
1 millón de tokens de audio de salida $12 $12 N/A N/A



Gemini 2.5 Flash Lite
Entrada (texto, imagen, video) $0.1 $0.1 N/A N/A
Entrada de audio $0.5 $0.5 N/A N/A
Salida de texto (respuesta y razonamiento) USD 0.4 USD 0.4 N/A N/A


Grounding with Google Search
Gemini 2.0 Flash, 2.5 Flash y 2.5 Flash-Lite incluyen 1,500 instrucciones basadas en la realidad por día sin cargo adicional. Gemini 2.5 Pro incluye 10,000 instrucciones basadas en la realidad por día sin costo adicional.

Las instrucciones fundamentadas que superen esos límites se facturarán a $35 por cada 1,000 instrucciones fundamentadas.

Una instrucción basada en datos es una solicitud enviada a Gemini que hace una o más consultas a la Búsqueda de Google&ast;&ast;. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos.

Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día.

Protección contra la Web para empresas
USD 45 por cada 1,000 instrucciones fundamentadas. Una instrucción de conexión a tierra es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas**. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos.

Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día.
Fundamentación con tus datos USD 2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025.

* Si el contexto de entrada de una consulta es más largo que 200,000 tokens, todos los tokens (de entrada y salida) se cobran con las tarifas de contexto largo.
** La función de conexión a la tierra con la Búsqueda de Google y la Conexión a tierra de la Web para empresas solo se factura cuando una ventana emergente devuelve correctamente resultados de la Web (es decir, resultados que contengan al menos una URL de asistencia de conexión a tierra de la Web). Las tarifas de uso de los modelos de Gemini se aplican por separado.

Gemini 2.0

Gemini 2.0 se factura en función de los tokens. Para calcular la cantidad de tokens de entrada en tu solicitud antes de enviarla, puedes usar el analizador de tokens del SDK o la API de countTokens. Si tu solicitud falla con un error 400 o 500, no se te cobrarán los tokens que se usaron.

Usa el botón de activación en la tabla de precios para comparar los precios basados en tokens y los precios basados en modalidades.

Precios basados en tokens

Modelo Tipo Precio Precio con la API de lotes




Gemini 2.0 Flash
1 millón de tokens de entrada $0.15 $0.075
1 millón de tokens de audio de entrada $1.00 $0.50
1 millón de tokens de texto de salida $0.60 $0.30
Ajuste para 1 millón de tokens de entrenamiento $3.00




Generación de imágenes de Gemini 2.0 Flash
1 millón de tokens de entrada $0.15
1 millón de tokens de entrada de audio $1.00
1 millón de tokens de video de entrada $3
1 millón de tokens de texto de salida $0.60
1 millón de tokens de imagen de salida $30.00




API de Gemini 2.0 Flash Live
1 millón de tokens de texto de entrada $0.5
1 millón de tokens de entrada de audio $3
1 millón de tokens de video de entrada $3
1 millón de tokens de texto de salida $2
1 millón de tokens de audio de salida $12




Gemini 2.0 Flash Lite
1 millón de tokens de entrada $0.075 $0.0375
1 millón de tokens de entrada de audio $0.075 $0.0375
1 millón de tokens de texto de salida $0.30 $0.15
Ajuste para 1 millón de tokens de entrenamiento $1.00


Grounding with Google Search
Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1,500 instrucciones basadas en la realidad por día sin costo adicional.

Las instrucciones fundamentadas que superen esos límites se facturarán a $35 por cada 1,000 instrucciones fundamentadas.

Una instrucción fundamentada es una solicitud enviada a Gemini que realiza una o más búsquedas en la Búsqueda de Google*. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos.

Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día.

Protección contra la Web para empresas
USD 45 por cada 1,000 instrucciones fundamentadas. Una instrucción de conexión a tierra es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos.

Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día.
Fundamentación con tus datos USD 2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025.

Precios basados en modalidades

Los precios de las modalidades que se indican a continuación se basan en casos de uso promedio solo como referencia. La facturación real solo se basará en tokens:

  • 4 caracteres dan como resultado aproximadamente 1 token de texto, incluidos los espacios en blanco.
  • Para una imagen de 1024 x 1024, consume 1,290 tokens. El recuento de tokens por imagen varía según la resolución de la imagen. Para obtener más información sobre cómo calcular los tokens, puedes consultar nuestra documentación.
  • La entrada de video consume 258 tokens por segundo a una velocidad de muestreo de un fotograma por segundo. El video con audio factura tanto los tokens de video como los tokens de audio.
  • La entrada de audio consume 25 tokens por segundo sin marca de tiempo.
Modelo Tipo Precio Precio con la API de lotes




Gemini 2.0 Flash
Texto de entrada (caracteres $/M) $0.0375 $0.01875
Imagen de entrada ($/image) $0.0001935 $0.00009675
Video de entrada (USD/s) $0.0000387 $0.00001935
Audio de entrada ($/s) $0.000025 $0.0000125
Texto de salida (caracteres $/M) $0.15 $0.075




Generación de imágenes de Gemini 2.0 Flash
Texto de entrada (caracteres $/M) $0.0375
Imagen de entrada ($/image) $0.0001935
Video de entrada (USD/s) $0.0000387
Audio de entrada ($/s) $0.000025
Texto de salida (caracteres $/M) $0.15
Imagen de salida (imagen) ($/image) $0.04





Gemini 2.0 Flash Lite
Texto de entrada (caracteres $/M) $0.01875 $0.009375
Imagen de entrada ($/image) $0.00009675 $0.000048375
Video de entrada (USD/s) $0.00001935 $0.000009675
Audio de entrada ($/s) $0.000001875 $0.000000938
Texto de salida (caracteres $/M) $0.075 $0.0375


Grounding with Google Search
Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1,500 instrucciones basadas en la realidad por día sin costo adicional.

Las instrucciones fundamentadas que superen esos límites se facturarán a $35 por cada 1,000 instrucciones fundamentadas.

Una instrucción fundamentada es una solicitud enviada a Gemini que realiza una o más búsquedas en la Búsqueda de Google*. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos.

Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día.

Protección contra la Web para empresas
USD 45 por cada 1,000 instrucciones fundamentadas. Una instrucción de conexión a tierra es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos.

Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día.

* Los precios aparecen en dólares estadounidenses (USD). Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* Los tokens de entrenamiento se calculan con la cantidad total de tokens en el conjunto de datos de entrenamiento, multiplicados por la cantidad de épocas.
* Los PDF se facturan como entrada de imagen, con una página de PDF equivalente a una imagen.
* El extremo del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La conexión a tierra con la Búsqueda de Google y la Conexión a tierra de la Web para empresas se factura solo cuando una instrucción devuelve correctamente resultados de la Web (es decir, resultados que contengan al menos una URL de asistencia de conexión a tierra de la Web). Las tarifas de uso de los modelos de Gemini se aplican por separado.
* API de Gemini 2.0 Flash Live: 25 tokens por segundo de audio (entrada/salida), 258 tokens por segundo de video (entrada). La fundamentación con la Búsqueda de Google seguirá siendo sin costo mientras la API de Gemini 2.0 Flash Live esté en versión preliminar.

Precios del optimizador de modelos de Vertex AI (experimental)*

Vertex AI Model Optimizer simplifica el uso de Gemini para los clientes empresariales, ya que proporciona un único meta-extremo para las solicitudes de modelos de Gemini. Los clientes que usan este servicio no tienen que especificar si usar Flash, Pro o una versión específica. En cambio, solo proporcionan un parámetro de configuración (costo, calidad o equilibrio) para indicar sus preferencias, y el optimizador de modelos aplica el nivel de inteligencia adecuado para la tarea enviando cada consulta al modelo que mejor se adapte.

El optimizador de modelos de Vertex AI aplica precios dinámicos. Esto significa que el precio promedio por token depende del nivel de inteligencia del modelo aplicado para completar la tarea. Por este motivo, a continuación se incluyen ejemplos de precios para ilustrar situaciones probables según tu configuración (consulta las tablas a continuación). Los SKU de Model Optimizer son SKU de USD 1 que funcionan como una unidad de compra para aplicar a tu facturación; aún se te facturará según el consumo después de que hayas usado los modelos.

Relación de E/S de 5:1 Ejemplo 1:
Chatbot
NOTA: Estos rangos no son garantías, los resultados de los clientes individuales pueden variar
Preferencia del cliente Tokens de entrada del cliente enviados al objetivo de marketing Tokens de salida del cliente enviados a MO Precio de entrada promedio por millón de tokens (rango alto) Precio de salida promedio por millón de tokens (rango alto) Precio de entrada promedio por millón de tokens (rango bajo) Precio de salida promedio por millón de tokens (rango bajo)
Costo 10,000,000 2,000,000 USD 0.63 $2.50 $0.16 USD 0.63
Equilibrado 10,000,000 2,000,000 $1.26 $5.00 USD 0.63 $2.50
Calidad 10,000,000 2,000,000 $1.89 $7.50 $1.26 $5.00
Proporción de E/S de 1:20 Ejemplo 2: Generación de contenido
Preferencia del cliente Tokens de entrada del cliente enviados al objetivo de marketing Tokens de salida del cliente enviados a MO Precio de entrada promedio por millón de tokens (rango alto) Precio de salida promedio por millón de tokens (rango alto) Precio de entrada promedio por millón de tokens (rango bajo) Precio de salida promedio por millón de tokens (rango bajo)
Costo 1,000,000 20,000,000 USD 0.63 $2.50 $0.16 USD 0.63
Equilibrado 1,000,000 20,000,000 $1.26 $5.00 USD 0.63 $2.50
Calidad 1,000,000 20,000,000 $1.89 $7.50 $1.26 $5.00

* Model Optimizer es una oferta experimental pagada y puede enrutar solicitudes a versiones experimentales de Gemini en Vertex.

Otros modelos de Gemini

Todos los modelos de Gemini, excepto Gemini 2.0, se facturan según modalidades como caracteres, imágenes y segundos de video o audio. La entrada de texto se cobra por cada 1,000 caracteres de entrada (mensaje) y cada 1,000 caracteres de salida (respuesta). Los caracteres se cuentan mediante puntos de código UTF-8 y el espacio en blanco se excluye del conteo, lo que da como resultado aproximadamente 4 caracteres por token. Las solicitudes de predicción que generan respuestas filtradas se cobran solo por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo ($0.01) se redondean a un centavo. Las entradas de medios se cobran por imagen o por segundo (video). Si tu solicitud falla con un error 400 o 500, no se te cobrará por los tokens usados.

Modelo Atributo Tipo Precio
( =<128,000 tokens de entrada)
Precio
(> 128,000 tokens de entrada)
Gemini 1.5 Flash Multimodal Entrada de imagen
Entrada de video
Entrada de texto
Entrada de audio
$0.00002 por imagen
$0.00002 por segundo
$0.00001875 por 1,000 caracteres
$0.000002 por segundo
$0.00004 por imagen
$0.00004 por segundo
$0.0000375 por 1,000 caracteres
$0.000004 por segundo
Salida de texto $0.000075 por 1,000 caracteres $0.00015 / 1,000 caracteres
Ajustes* Token de entrenamiento USD 8 por millón de tokens
Gemini 1.5 Pro Multimodal Entrada de imagen
Entrada de video
Entrada de texto
Entrada de audio
$0.00032875 por imagen
$0.00032875 por segundo
$0.0003125 por 1,000 caracteres
$0.00003125 por segundo
$0.0006575 por imagen
$0.0006575 por segundo
$0.000625 por 1,000 caracteres
$0.0000625 por segundo
Salida de texto $0.00125 por 1,000 caracteres $0.0025 por 1,000 caracteres
Ajustes* Token de entrenamiento USD 80 por millón de tokens
Gemini 1.0 Pro Multimodal Entrada de imagen
Entrada de video
Entrada de texto
$0.0025 por imagen
$0.002 por segundo
$0.000125 por 1,000 caracteres
Salida de texto $0.000375 por 1,000 caracteres
Fundamentación con la Búsqueda de Google Texto USD 35 por cada 1,000 instrucciones basadas en hechos.

Una instrucción fundamentada es una solicitud enviada a Gemini que realiza una o más búsquedas en la Búsqueda de Google*. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos.

Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día.
Conexión a tierra de la Web para empresas Texto USD 45 por cada 1,000 instrucciones fundamentadas.

Una instrucción de conexión a tierra es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos.

Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día.
Fundamentación con tus datos Texto $2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025.

* Los precios aparecen en dólares estadounidenses (USD). Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* Si el contexto de una consulta es más largo que 128,000, todos los tokens se cobran con las tarifas de contexto largo.
* Los modelos de Gemini están disponibles en modo por lotes con un 50% de descuento.
* Gemini 1.0 Pro solo admite una ventana de contexto de hasta 32,000.
* Los PDF se facturan como entrada de imagen, con una página de PDF equivalente a una imagen.
* El extremo del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La conexión a tierra con la Búsqueda de Google y la Conexión a tierra de la Web para empresas solo se factura cuando una ventana emergente devuelve correctamente resultados de la Web (es decir, resultados que contengan al menos una URL de asistencia de conexión a tierra de la Web). Se aplican tarifas de uso de modelos de Gemini por separado.

Imagen

Con Imagen en Vertex AI, puedes generar imágenes nuevas y editar imágenes según las instrucciones de texto que proporciones, o editar solo partes de imágenes mediante un área de máscara que definas junto con muchas otras capacidades.

Modelo Función Descripción Entrada Resultado Precio
Imagen 4 Ultra Generación de imágenes Genera una imagen Instrucción de texto Imagen $0.06 por imagen
Imagen 4 Generación de imágenes Genera una imagen Instrucción de texto Imagen $0.04 por imagen
Imagen 4 Fast Generación de imágenes Genera una imagen Instrucción de texto Imagen $0.02 por imagen
Imagen 3 Generación de imágenes Generar una imagen
Editar una imagen
Personalizar una imagen
Instrucción de texto Imagen $0.04 por imagen
Imagen 3: Rápido Generación de imágenes Genera una imagen Instrucción de texto Imagen $0.02 por imagen
Imagen 2, Imagen Generación de imágenes Genera una imagen Instrucción de texto Imagen $0.020 por imagen
Edición de imágenes Edita una imagen con el enfoque “máscara” o “sin máscara” Instrucción de imagen/texto Imagen $0.020 por imagen
Mejora de la resolución Aumenta la resolución de una imagen generada a 2k y 4k Imagen Imagen $0.003 por imagen
Ajuste Habilita un "asunto" proporcionado por el usuario para usarlo en instrucciones de Imagen (entrenamiento de pocas tomas) Asuntos con identificador de texto y 4 a 8 imágenes por sujeto Modelo preciso (después del entrenamiento con sujetos proporcionados por el usuario) $ por hora de procesamiento de nodo (precios de entrenamiento personalizado de Vertex AI)
Subtítulos visuales Genera una leyenda de texto corta o larga para una imagen Imagen Leyenda de texto $0.0015/imagen
Preguntas y respuestas visuales Proporciona una respuesta basada en una pregunta que haga referencia a una imagen Instrucción de imagen/texto Respuesta de texto $0.0015/imagen

Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.

Veo

Veo 2 crea videos de una calidad increíblemente alta en una amplia gama de temas y estilos, lo que permite comprender mejor la física del mundo real y los matices del movimiento y la expresión humanos.

Modelo Función Descripción Entrada Salida Precio
Veo 3 Generación de video Generar videos a partir de una instrucción de texto o una imagen de referencia Instrucción de texto/imagen Video $0.50 por segundo
Veo 3 Generación de video y audio Generar videos con efectos de voz y sonido sincronizados a partir de una instrucción de texto o una imagen de referencia Instrucción de texto/imagen Video y audio $0.75/segundo
Veo 2 Generación de video Generar videos a partir de una instrucción de texto o una imagen de referencia Instrucción de texto/imagen Video $0.50 por segundo
Veo 2 Controles avanzados Generar videos a través de la interpolación de fotogramas de inicio y finalización, extender videos generados y aplicar controles de cámara Instrucción de texto/imagen/video Video $0.50 por segundo

Lyria

Lyria 2 ofrece generación de música instrumental de alta calidad que es ideal para composiciones sofisticadas y una exploración creativa detallada en la que la salida con matices es clave.

Modelo Función Descripción Entrada Salida Precio
Lyria 2 Generación de música Generar música a partir de una instrucción de texto Instrucción de texto Música $0.06 por 30 segundos

Comprender los costos de incorporación para tus aplicaciones de IA

Modelo Tipo Región Precio por 1,000 tokens de entrada
Incorporación de Gemini Entrada Global
  • Solicitudes en línea: $0.00015
  • Solicitudes por lotes: $0.00012
Salida Global
  • Solicitudes en línea: sin cargo
  • Solicitudes en lotes: sin cargo
Modelo Tipo Región Precio por 1,000 caracteres
Incorporaciones para texto
(Excluyendo la incorporación de Gemini)
Entrada Global
  • Solicitudes en línea: $0.000025
  • Solicitudes por lotes: $0.00002
Salida Global
  • Solicitudes en línea: sin cargo
  • Solicitudes en lotes: sin cargo
Modelo Función Descripción Entrada Resultado Precio
multimodalembedding Incorporaciones para multimodales: texto Genera incorporaciones con texto como entrada Texto Incorporaciones $0.0002 / 1,000 caracteres de entrada
Incorporaciones para multimodales: imagen Genera incorporaciones con imagen como entrada Imagen Incorporaciones $0.0001 / imagen de entrada
Incorporaciones para multimodales: video plus Video Plus Video Incorporaciones (hasta 15 incorporaciones por minuto de video) $0.0020 por segundo de video
Incorporaciones para multimodales: Estándar de video Video Standard Video Incorporaciones (hasta 8 incorporaciones por minuto de video) $0.0010 por segundo de video
Incorporaciones para multimodales: elementos esenciales de video Video Essential Video Incorporaciones (hasta 4 incorporaciones por minuto de video) $0.0005 por segundo de video

Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.

Precios de la finalización de código de Vertex AI

La asistencia de IA generativa en Vertex AI cobra por cada 1,000 caracteres de entrada (mensaje) y cada 1,000 caracteres de salida (respuesta). Los caracteres se cuentan mediante puntos de código UTF-8 y el espacio en blanco se excluye del recuento. Durante la etapa de vista previa, los cargos tienen un 100% de descuento. Las solicitudes de predicción que generan respuestas filtradas se cobran solo por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo ($0.01) se redondean a un centavo.

Modelo Tipo Región Precio por 1,000 caracteres
Codey para completar código Entrada Global
  • Solicitudes en línea: $0.00025
Salida Global
  • Solicitudes en línea: $0.0005

Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.

Traducción (texto)

Usar la API de Vertex AI y el LLM de Translation para traducir texto Las traducciones de los LLM suelen ser más fluidas y sonar más humanas que las de los modelos de traducción clásicos, pero tienen una compatibilidad con el idioma más limitada (Más información).

Modelo Método Uso Precio por millón de caracteres
LLM Traducción de texto* La cantidad de caracteres de entrada por mes

$10 por millón de caracteres*

La cantidad de caracteres de salida por mes

$10 por millón de caracteres*

Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* El precio se calcula por carácter procesado por el modelo. Consulta Caracteres que se cobran
para obtener más detalles sobre los caracteres que se consideran en el precio.

Optimiza los costos con el almacenamiento en caché de contexto de Vertex AI

Con el almacenamiento en caché del contexto, puedes reducir el costo del procesamiento de tokens de entrada de Gemini en un 75% y la latencia de la generación de contenido almacenando en caché la parte del contexto de tu texto de entrada o contenido multimedia en los modelos de Gemini. La cantidad de tiempo que los datos se almacenan en la caché, que puede controlar el usuario, determina los cargos de “Almacenamiento de caché de contexto”. Cuando se crea un contexto en caché, se les cobrará a los usuarios el costo estándar del token de entrada. Los aciertos de caché en los datos de entrada se cobran a una tarifa reducida, “Entrada almacenada en caché”, en lugar del costo de entrada normal. El tamaño de los datos para el almacenamiento y la entrada se calcula de la misma manera que el precio de la entrada de Gemini.

Modelos de Gemini 2.5

Modelo Atributo Tipo Precio (/1 millón de tokens)
<= 200,000 tokens de entrada
Precio (/1M tokens)
> 200,000 tokens de entrada
Gemini 2.5 Pro Entrada almacenada en caché Entrada (texto, imagen, video, audio) $0.31 (/1 millón de tokens) USD 0.625 (/1 millón de tokens)
Salida N/A N/A
Almacenamiento de caché de contexto Entrada (texto, imagen, video, audio) $4.5 (/M Tok/h) $4.5 (/M Tok/h)
Gemini 2.5 Flash Entrada almacenada en caché Entrada (texto, imagen, video, audio) $0.0375 (/1 millón de tokens) $0.0375 (/1 millón de tokens)
Salida N/A N/A
Almacenamiento de caché de contexto Entrada (texto, imagen, video, audio) USD 1 (/M Tok/h) USD 1 (/M Tok/h)

Modelos de Gemini 2.0

Precios basados en tokens


Modelo

Tipo
Almacenamiento
(M tok-hour)
Precio




Gemini 2.0 Flash
1 millón de tokens de entrada $1.00 $0.0375
1 millón de tokens de entrada de audio $1.00 $0.25
1 millón de tokens de texto de salida N/A N/A


Gemini 2.0 Flash Lite
1 millón de tokens de entrada $1.00 $0.01875
1 millón de tokens de entrada de audio $1.00 $0.01875
1 millón de tokens de texto de salida N/A N/A

Precios basados en modalidades

Los precios de las modalidades que se indican a continuación se basan en casos de uso promedio solo como referencia. La facturación real solo se basará en tokens:

  • 4 caracteres dan como resultado aproximadamente 1 token de texto, incluidos los espacios en blanco.
  • Para una imagen de 1024 x 1024, consume 1,290 tokens. El recuento de tokens por imagen varía según la resolución de la imagen. Para obtener más información sobre cómo calcular los tokens, puedes consultar nuestra documentación.
  • La entrada de video consume 258 tokens por segundo a una velocidad de muestreo de un fotograma por segundo. El video con audio factura tanto los tokens de video como los tokens de audio.
  • La entrada de audio consume 25 tokens por segundo sin marca de tiempo.

Modelo

Tipo
Almacenamiento
(modalidad-hora)

Precio




Gemini 2.0 Flash
Texto de entrada (caracteres $/M) $0.25 $0.009375
Imagen de entrada ($/image) $0.00129 $0.000048375
Video de entrada (USD/s) $0.000258 $0.000009675
Audio de entrada ($/s) $0.000025 $0.00000625
Texto de salida (caracteres $/M) N/A N/A




Gemini 2.0 Flash Lite
Texto de entrada (caracteres $/M) $0.25 $0.0046875
Imagen de entrada ($/image) $0.00129 $0.0000241875
Video de entrada (USD/s) $0.000258 $0.000009675
Audio de entrada ($/s) $0.000258 $0.0000048375
Texto de salida (caracteres $/M) N/A N/A


Grounding with Google Search
Gemini 2.0 Flash incluye hasta 1,500 solicitudes de verificación de datos por día sin cargo adicional. Las solicitudes de conexión a tierra
que superen las 1,500 por día se facturan a USD 35 por cada 1,000 solicitudes (hasta 1 millón de solicitudes por día).

Si necesitas más de 1 millón de solicitudes por día, comunícate con tu equipo de cuentas.

Protección contra la Web para empresas
$45 por cada 1,000 solicitudes (hasta 1 millón de solicitudes por día) a partir del 5 de mayo de 2025.

Si necesitas más de 1 millón de solicitudes por día, comunícate con tu equipo de cuentas.

* Los precios aparecen en dólares estadounidenses (USD). Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* Los PDF se facturan como entrada de imagen, con una página de PDF equivalente a una imagen.
* El extremo del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La vinculación con la Búsqueda de Google solo se factura por las solicitudes que devuelven resultados que contienen al menos una URL de asistencia de vinculación de la Web. También se aplican las tarifas de uso del modelo Gemini estándar.

Capacidad de procesamiento aprovisionada

La capacidad de procesamiento aprovisionada garantiza la capacidad de procesamiento para tus necesidades de IA generativa y se realiza a través de unidades de escala de IA generativa, o GSU. Obtén más información sobre la capacidad de procesamiento que proporciona cada GSU aquí y usa nuestro estimador en línea aquí.

Duración Precio por GSU Por
1 confirmación de la semana USD 1,200 Semana
Compromiso de 1 mes USD 2,700 Mes
Compromiso de 3 meses USD 2,400 Mes
Compromiso por 1 año $2,000 Mes

Ejemplo de cálculo de costos

Un usuario necesita asegurarse de que puede admitir 10 consultas por segundo (QPS) de una consulta con una entrada de 1,000 tokens de texto y 500 tokens de audio, y recibir un resultado de 300 tokens de texto con gemini-2.0-flash.

Con la tabla de rendimiento y tasa de consumo, sabemos que la tasa de consumo de un token de texto de entrada es de 1 token, la tasa de consumo de un token de audio de entrada es de 7 tokens y la tasa de consumo de un token de texto de salida es de 4 tokens.

El total de tokens de entrada del usuario es 1,000* (1 token por token de texto de entrada) + 500* (7 tokens por token de audio de entrada) = 4,500 tokens de entrada ajustados de burndown. El total de tokens de salida del usuario es 300* (4 tokens por token de texto de salida) = 1,200 tokens de salida ajustados de burndown. Si los sumamos, obtenemos 4,500 tokens de entrada ajustados por burndown + 1,200 tokens de salida ajustados por burndown = 5,700 tokens en total por consulta.

Si multiplicamos los tokens totales por consulta por las QPS, obtenemos 5,700 tokens totales por consulta * 10 QPS = 57,000 tokens totales por segundo.

Si dividimos esto por la capacidad de procesamiento total por segundo por GSU, obtenemos 57,000 tokens totales por segundo ÷ 3,360 de capacidad de procesamiento por segundo por GSU = 16.96 GSU. El incremento mínimo de compra de GSU para este modelo es de 1, por lo que el usuario necesitaría 17 GSU.

Si el usuario quisiera mantener esta capacidad de procesamiento durante 1 semana, le costaría $1,200 * 17 GSUs = $20,400 por semana. Si quisieran mantener esta capacidad de procesamiento durante 1 mes, les costaría $2,700 * 17 GSU = $45,900 por mes. Si quisieran mantener esta capacidad de procesamiento durante 3 meses, el costo sería de $2,400 * 17 GSU = $40,800 por mes. Por último, si quisieran mantener esta capacidad de procesamiento durante 1 año, el costo sería de $2,000 * 17 GSU = $34,000 por mes.

Compara los precios de los modelos de socios en Vertex AI

Los modelos de socios son una lista seleccionada de modelos de IA generativa que desarrollan los socios de Google. Los modelos de socios se ofrecen como APIs administradas. Para obtener más información, consulta Descripción general de los modelos de socios. En las siguientes secciones, se enumeran los detalles de precios para los modelos de socios de Google.

Modelos de AI21 Labs

Modelo Precios
Jamba 1.5 Large Entrada: $2 por millón de tokens
Salida: $8 por millón de tokens
Jamba 1.5 Mini Entrada: $0.20 por cada millón de tokens
Salida: $0.40 por cada millón de tokens

Modelos Claude de Anthropic

Modelo Precios
Claude Opus 4 Entrada: $15 / millón de tokens
Salida: $75 / millón de tokens

Entrada por lotes: $7.50 / millón de tokens
Salida por lotes: $37.50 / millón de tokens

Escritura en caché: $18.75 / millón de tokens
Acceso a la caché: $1.50 / millón de tokens

Escritura en caché por lotes: $9.375 / millón de tokens
Acceso a la caché por lotes: $0.75 / millón de tokens
Claude Sonnet 4 Entrada: $3 / millón de tokens
Salida: $15 / millón de tokens

Entrada por lotes: $1.50 / millón de tokens
Salida por lotes: $7.50 / millón de tokens

Escritura en caché: $3.75 / millón de tokens
Acceso a la caché: $0.30 / millón de tokens

Escritura en caché por lotes: $1.875 / millón de tokens
Acceso a la caché por lotes: $0.15 / millón de tokens
Claude 3.7 Sonnet Entrada: $3 / millón de tokens
Salida: $15 / millón de tokens

Entrada por lotes: $1.50 / millón de tokens
Salida por lotes: $7.50 / millón de tokens

Escritura en caché: $3.75 / millón de tokens
Acceso a la caché: $0.30 / millón de tokens

Escritura en caché por lotes: $1.875 / millón de tokens
Acceso a la caché por lotes: $0.15 / millón de tokens
Claude 3.5 Haiku Entrada: $0.80 / millón de tokens
Salida: $4 / millón de tokens

Entrada por lotes: $0.40 / millón de tokens
Salida por lotes: $2 / millón de tokens

Escritura en caché: $1 / millón de tokens
Acceso a la caché: $0.08 / millón de tokens

Escritura en caché por lotes: $0.50 / millón de tokens
Acceso a la caché por lotes: $0.04 / millón de tokens
Claude 3.5 Sonnet v2 Entrada: $3 / millón de tokens
Salida: $15 / millón de tokens

Entrada por lotes: $1.50 / millón de tokens
Salida por lotes: $7.50 / millón de tokens

Escritura en caché: $3.75 / millón de tokens
Acceso a la caché: $0.30 / millón de tokens

Escritura en caché por lotes: $1.875 / millón de tokens
Acceso a la caché por lotes: $0.15 / millón de tokens
Claude 3.5 Sonnet Entrada: $3 / millón de tokens
Salida: $15 / millón de tokens

Escritura en caché: $3.75 / millón de tokens
Tiro correcto en la caché: $0.30 / millón de tokens
Claude 3 Haiku Entrada: $0.25 / millón de tokens
Salida: $1.25 / millón de tokens

Escritura en caché: $0.30 / millón de tokens
Tiro correcto en la caché: $0.03 / millón de tokens
Claude 3 Sonnet (deprecated) Entrada: $3 por millón de tokens
Salida: $15 por millón de tokens
Claude 3 Opus Entrada: $15 por millón de tokens
Salida: $75 por millón de tokens

Escritura en caché: $18.75 por millón de tokens
Acceso a la caché: $1.50 por millón de tokens

Modelos Llama de Meta

Modelo Precios
Llama 3.1 405b Entrada: $5.00 / millón de tokens
Salida: $16.00 / millón de tokens
Llama 3.3 70B * Entrada: $0.72 por millón de tokens
Salida: $0.72 por millón de tokens
Scout de Llama 4 * Entrada: $0.25 por millón de tokens
Salida: $0.70 por millón de tokens
Llama 4 Maverick * Entrada: $0.35 por millón de tokens
Salida: $1.15 por millón de tokens
  • Disponible sin cargo hasta el 1 de mayo de 2025.

Modelos de Mistral AI

Modelo Precios
OCR de Mistral (25.05) Entrada: $0.0005 / millón de tokens (o $0.0005/página)
Salida: $0.0005 / millón de tokens (o $0.0005/página)
Mistral Small 3.1 (25.03) Entrada: $0.10 / millón de tokens
Salida: $0.30 / millón de tokens
Mistral grande (24.11) Entrada: $2.00 por millón de tokens
Salida: $6.00 por millón de tokens
Mistral Nemo Entrada: $0.15 por cada millón de tokens
Salida: $0.15 por cada millón de tokens
Codestral (25.01) Entrada: $0.30 por millón de tokens
Salida: $0.90 por millón de tokens

Solicita una cotización personalizada

Con los precios de pago por uso de Google Cloud, solo pagas por los servicios que usas. Comunícate con nuestro equipo de Ventas y obtén una cotización personalizada para tu organización.
Comunicarse con Ventas