Costo de crear y, luego, implementar modelos de IA en Vertex AI
Los precios aparecen en dólares estadounidenses (USD). Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en SKU de Google Cloud.
Solo se te cobrará por las solicitudes que devuelvan un código de respuesta 200. Las solicitudes que devuelven otros códigos de respuesta, como los códigos 4xx y 5xx, no se cobran por la entrada ni la salida.
En esta página, se abordan los precios de la asistencia de IA generativa en Vertex AI. Para obtener información sobre todos los demás precios de Vertex AI, incluidos los servicios de ML Platform y MLOps, consulta la página de precios de Vertex AI.
Modelos de Google
Gemini 2.5
Modelo | Tipo | Precio (/1 millón de tokens) <= 200,000 tokens de entrada | Precio (/1M tokens) > 200,000 tokens de entrada | Precio (/1M tokens) <= 200K tokens de entrada con la API por lotes | Precio (/1M tokens) > 200,000 tokens de entrada con la API por lotes |
---|---|---|---|---|---|
Gemini 2.5 Pro | |||||
Entrada (texto, imagen, video, audio) | USD 1.25 | USD 2.5 | $0.625 | USD 1.25 | |
Salida de texto (respuesta y razonamiento) | $10 | $15 | $5 | USD 7.5 | |
Gemini 2.5 Flash GA |
|||||
Entrada (texto, imagen, video) | $0.30 | $0.30 | $0.15 | $0.15 | |
Entrada de audio | $1 | $1 | $0.5 | $0.5 | |
Salida de texto | $2.50 | $2.50 | USD 1.25 | USD 1.25 | |
Ajuste para 1 millón de tokens de entrenamiento | $5.00 | N/A | N/A | N/A | |
Versión preliminar de Gemini 2.5 Flash (Los extremos se retiraron el 15/7/2025) |
|||||
Entrada (texto, imagen, video) | $0.15 | $0.15 | $0.075 | $0.075 | |
Entrada de audio | $1 | $1 | $0.5 | $0.5 | |
Salida de texto (sin pensar) | $0.60 | $0.60 | $0.30 | $0.30 | |
Salida de texto (respuesta de pensamiento y razonamiento) | $3.50 | $3.50 | $1.75 | $1.75 | |
API de Gemini 2.5 Flash Live |
|||||
1 millón de tokens de texto de entrada | $0.5 | $0.5 | N/A | N/A | |
1 millón de tokens de entrada de audio | $3 | $3 | N/A | N/A | |
1 millón de tokens de video de entrada | $3 | $3 | N/A | N/A | |
1 millón de tokens de texto de salida | $2 | $2 | N/A | N/A | |
1 millón de tokens de audio de salida | $12 | $12 | N/A | N/A | |
Gemini 2.5 Flash Lite |
|||||
Entrada (texto, imagen, video) | $0.1 | $0.1 | N/A | N/A | |
Entrada de audio | $0.5 | $0.5 | N/A | N/A | |
Salida de texto (respuesta y razonamiento) | USD 0.4 | USD 0.4 | N/A | N/A | |
Grounding with Google Search |
Gemini 2.0 Flash, 2.5 Flash y 2.5 Flash-Lite incluyen 1,500 instrucciones basadas en la realidad por día sin cargo adicional. Gemini 2.5 Pro incluye 10,000 instrucciones basadas en la realidad por día sin costo adicional. Las instrucciones fundamentadas que superen esos límites se facturarán a $35 por cada 1,000 instrucciones fundamentadas. Una instrucción basada en datos es una solicitud enviada a Gemini que hace una o más consultas a la Búsqueda de Google**. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día. |
||||
Protección contra la Web para empresas |
USD 45 por cada 1,000 instrucciones fundamentadas. Una instrucción de conexión a tierra es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas**. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día. |
||||
Fundamentación con tus datos | USD 2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025. |
* Si el contexto de entrada de una consulta es más largo que 200,000 tokens, todos los tokens (de entrada y salida) se cobran con las tarifas de contexto largo.
** La función de conexión a la tierra con la Búsqueda de Google y la Conexión a tierra de la Web para empresas solo se factura cuando una ventana emergente devuelve correctamente resultados de la Web (es decir, resultados que contengan al menos una URL de asistencia de conexión a tierra de la Web). Las tarifas de uso de los modelos de Gemini se aplican por separado.
Gemini 2.0
Gemini 2.0 se factura en función de los tokens. Para calcular la cantidad de tokens de entrada en tu solicitud antes de enviarla, puedes usar el analizador de tokens del SDK o la API de countTokens. Si tu solicitud falla con un error 400 o 500, no se te cobrarán los tokens que se usaron.
Usa el botón de activación en la tabla de precios para comparar los precios basados en tokens y los precios basados en modalidades.
Precios basados en tokens
Modelo | Tipo | Precio | Precio con la API de lotes |
---|---|---|---|
Gemini 2.0 Flash |
|||
1 millón de tokens de entrada | $0.15 | $0.075 | |
1 millón de tokens de audio de entrada | $1.00 | $0.50 | |
1 millón de tokens de texto de salida | $0.60 | $0.30 | |
Ajuste para 1 millón de tokens de entrenamiento | $3.00 | ||
Generación de imágenes de Gemini 2.0 Flash |
|||
1 millón de tokens de entrada | $0.15 | ||
1 millón de tokens de entrada de audio | $1.00 | ||
1 millón de tokens de video de entrada | $3 | ||
1 millón de tokens de texto de salida | $0.60 | ||
1 millón de tokens de imagen de salida | $30.00 | ||
API de Gemini 2.0 Flash Live |
|||
1 millón de tokens de texto de entrada | $0.5 | ||
1 millón de tokens de entrada de audio | $3 | ||
1 millón de tokens de video de entrada | $3 | ||
1 millón de tokens de texto de salida | $2 | ||
1 millón de tokens de audio de salida | $12 | ||
Gemini 2.0 Flash Lite |
|||
1 millón de tokens de entrada | $0.075 | $0.0375 | |
1 millón de tokens de entrada de audio | $0.075 | $0.0375 | |
1 millón de tokens de texto de salida | $0.30 | $0.15 | |
Ajuste para 1 millón de tokens de entrenamiento | $1.00 | ||
Grounding with Google Search |
Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1,500 instrucciones basadas en la realidad por día sin costo adicional. Las instrucciones fundamentadas que superen esos límites se facturarán a $35 por cada 1,000 instrucciones fundamentadas. Una instrucción fundamentada es una solicitud enviada a Gemini que realiza una o más búsquedas en la Búsqueda de Google*. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día. |
||
Protección contra la Web para empresas |
USD 45 por cada 1,000 instrucciones fundamentadas. Una instrucción de conexión a tierra es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día. |
||
Fundamentación con tus datos | USD 2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025. |
Precios basados en modalidades
Los precios de las modalidades que se indican a continuación se basan en casos de uso promedio solo como referencia. La facturación real solo se basará en tokens:
- 4 caracteres dan como resultado aproximadamente 1 token de texto, incluidos los espacios en blanco.
- Para una imagen de 1024 x 1024, consume 1,290 tokens. El recuento de tokens por imagen varía según la resolución de la imagen. Para obtener más información sobre cómo calcular los tokens, puedes consultar nuestra documentación.
- La entrada de video consume 258 tokens por segundo a una velocidad de muestreo de un fotograma por segundo. El video con audio factura tanto los tokens de video como los tokens de audio.
- La entrada de audio consume 25 tokens por segundo sin marca de tiempo.
Modelo | Tipo | Precio | Precio con la API de lotes |
---|---|---|---|
Gemini 2.0 Flash |
|||
Texto de entrada (caracteres $/M) | $0.0375 | $0.01875 | |
Imagen de entrada ($/image) | $0.0001935 | $0.00009675 | |
Video de entrada (USD/s) | $0.0000387 | $0.00001935 | |
Audio de entrada ($/s) | $0.000025 | $0.0000125 | |
Texto de salida (caracteres $/M) | $0.15 | $0.075 | |
Generación de imágenes de Gemini 2.0 Flash |
|||
Texto de entrada (caracteres $/M) | $0.0375 | ||
Imagen de entrada ($/image) | $0.0001935 | ||
Video de entrada (USD/s) | $0.0000387 | ||
Audio de entrada ($/s) | $0.000025 | ||
Texto de salida (caracteres $/M) | $0.15 | ||
Imagen de salida (imagen) ($/image) | $0.04 | ||
Gemini 2.0 Flash Lite |
|||
Texto de entrada (caracteres $/M) | $0.01875 | $0.009375 | |
Imagen de entrada ($/image) | $0.00009675 | $0.000048375 | |
Video de entrada (USD/s) | $0.00001935 | $0.000009675 | |
Audio de entrada ($/s) | $0.000001875 | $0.000000938 | |
Texto de salida (caracteres $/M) | $0.075 | $0.0375 | |
Grounding with Google Search |
Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1,500 instrucciones basadas en la realidad por día sin costo adicional. Las instrucciones fundamentadas que superen esos límites se facturarán a $35 por cada 1,000 instrucciones fundamentadas. Una instrucción fundamentada es una solicitud enviada a Gemini que realiza una o más búsquedas en la Búsqueda de Google*. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día. |
||
Protección contra la Web para empresas |
USD 45 por cada 1,000 instrucciones fundamentadas. Una instrucción de conexión a tierra es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día. |
* Los precios aparecen en dólares estadounidenses (USD).
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* Los tokens de entrenamiento se calculan con la cantidad total de tokens en el conjunto de datos de entrenamiento, multiplicados por la cantidad de épocas.
* Los PDF se facturan como entrada de imagen, con una página de PDF equivalente a una imagen.
* El extremo del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La conexión a tierra con la Búsqueda de Google y la Conexión a tierra de la Web para empresas se factura solo cuando una instrucción devuelve correctamente resultados de la Web (es decir, resultados que contengan al menos una URL de asistencia de conexión a tierra de la Web). Las tarifas de uso de los modelos de Gemini se aplican por separado.
* API de Gemini 2.0 Flash Live: 25 tokens por segundo de audio (entrada/salida), 258 tokens por segundo de video (entrada). La fundamentación con la Búsqueda de Google seguirá siendo sin costo mientras la API de Gemini 2.0 Flash Live esté en versión preliminar.
Precios del optimizador de modelos de Vertex AI (experimental)*
Vertex AI Model Optimizer simplifica el uso de Gemini para los clientes empresariales, ya que proporciona un único meta-extremo para las solicitudes de modelos de Gemini. Los clientes que usan este servicio no tienen que especificar si usar Flash, Pro o una versión específica. En cambio, solo proporcionan un parámetro de configuración (costo, calidad o equilibrio) para indicar sus preferencias, y el optimizador de modelos aplica el nivel de inteligencia adecuado para la tarea enviando cada consulta al modelo que mejor se adapte.
El optimizador de modelos de Vertex AI aplica precios dinámicos. Esto significa que el precio promedio por token depende del nivel de inteligencia del modelo aplicado para completar la tarea. Por este motivo, a continuación se incluyen ejemplos de precios para ilustrar situaciones probables según tu configuración (consulta las tablas a continuación). Los SKU de Model Optimizer son SKU de USD 1 que funcionan como una unidad de compra para aplicar a tu facturación; aún se te facturará según el consumo después de que hayas usado los modelos.
Relación de E/S de 5:1 | Ejemplo 1: Chatbot |
NOTA: Estos rangos no son garantías, los resultados de los clientes individuales pueden variar | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Preferencia del cliente | Tokens de entrada del cliente enviados al objetivo de marketing | Tokens de salida del cliente enviados a MO | Precio de entrada promedio por millón de tokens (rango alto) | Precio de salida promedio por millón de tokens (rango alto) | Precio de entrada promedio por millón de tokens (rango bajo) | Precio de salida promedio por millón de tokens (rango bajo) | |||||
Costo | 10,000,000 | 2,000,000 | USD 0.63 | $2.50 | $0.16 | USD 0.63 | |||||
Equilibrado | 10,000,000 | 2,000,000 | $1.26 | $5.00 | USD 0.63 | $2.50 | |||||
Calidad | 10,000,000 | 2,000,000 | $1.89 | $7.50 | $1.26 | $5.00 |
Proporción de E/S de 1:20 | Ejemplo 2: Generación de contenido | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Preferencia del cliente | Tokens de entrada del cliente enviados al objetivo de marketing | Tokens de salida del cliente enviados a MO | Precio de entrada promedio por millón de tokens (rango alto) | Precio de salida promedio por millón de tokens (rango alto) | Precio de entrada promedio por millón de tokens (rango bajo) | Precio de salida promedio por millón de tokens (rango bajo) | |||||
Costo | 1,000,000 | 20,000,000 | USD 0.63 | $2.50 | $0.16 | USD 0.63 | |||||
Equilibrado | 1,000,000 | 20,000,000 | $1.26 | $5.00 | USD 0.63 | $2.50 | |||||
Calidad | 1,000,000 | 20,000,000 | $1.89 | $7.50 | $1.26 | $5.00 |
Otros modelos de Gemini
Todos los modelos de Gemini, excepto Gemini 2.0, se facturan según modalidades como caracteres, imágenes y segundos de video o audio. La entrada de texto se cobra por cada 1,000 caracteres de entrada (mensaje) y cada 1,000 caracteres de salida (respuesta). Los caracteres se cuentan mediante puntos de código UTF-8 y el espacio en blanco se excluye del conteo, lo que da como resultado aproximadamente 4 caracteres por token. Las solicitudes de predicción que generan respuestas filtradas se cobran solo por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo ($0.01) se redondean a un centavo. Las entradas de medios se cobran por imagen o por segundo (video). Si tu solicitud falla con un error 400 o 500, no se te cobrará por los tokens usados.
Modelo | Atributo | Tipo | Precio ( =<128,000 tokens de entrada) |
Precio (> 128,000 tokens de entrada) |
||
---|---|---|---|---|---|---|
Gemini 1.5 Flash | Multimodal | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
$0.00002 por imagen $0.00002 por segundo $0.00001875 por 1,000 caracteres $0.000002 por segundo |
$0.00004 por imagen $0.00004 por segundo $0.0000375 por 1,000 caracteres $0.000004 por segundo |
||
Salida de texto | $0.000075 por 1,000 caracteres | $0.00015 / 1,000 caracteres | ||||
Ajustes* | Token de entrenamiento | USD 8 por millón de tokens | ||||
Gemini 1.5 Pro | Multimodal | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
$0.00032875 por imagen $0.00032875 por segundo $0.0003125 por 1,000 caracteres $0.00003125 por segundo |
$0.0006575 por imagen $0.0006575 por segundo $0.000625 por 1,000 caracteres $0.0000625 por segundo |
||
Salida de texto | $0.00125 por 1,000 caracteres | $0.0025 por 1,000 caracteres | ||||
Ajustes* | Token de entrenamiento | USD 80 por millón de tokens | ||||
Gemini 1.0 Pro | Multimodal | Entrada de imagen Entrada de video Entrada de texto |
$0.0025 por imagen $0.002 por segundo $0.000125 por 1,000 caracteres |
|||
Salida de texto | $0.000375 por 1,000 caracteres | |||||
Fundamentación con la Búsqueda de Google | Texto | USD 35 por cada 1,000 instrucciones basadas en hechos. Una instrucción fundamentada es una solicitud enviada a Gemini que realiza una o más búsquedas en la Búsqueda de Google*. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día. |
||||
Conexión a tierra de la Web para empresas | Texto | USD 45 por cada 1,000 instrucciones fundamentadas. Una instrucción de conexión a tierra es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias búsquedas a la Búsqueda de Google, solo se cobra una vez por una instrucción basada en hechos. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones basadas en hechos por día. |
||||
Fundamentación con tus datos | Texto | $2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025. |
* Los precios aparecen en dólares estadounidenses (USD).
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* Si el contexto de una consulta es más largo que 128,000, todos los tokens se cobran con las tarifas de contexto largo.
* Los modelos de Gemini están disponibles en modo por lotes con un 50% de descuento.
* Gemini 1.0 Pro solo admite una ventana de contexto de hasta 32,000.
* Los PDF se facturan como entrada de imagen, con una página de PDF equivalente a una imagen.
* El extremo del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La conexión a tierra con la Búsqueda de Google y la Conexión a tierra de la Web para empresas solo se factura cuando una ventana emergente devuelve correctamente resultados de la Web (es decir, resultados que contengan al menos una URL de asistencia de conexión a tierra de la Web). Se aplican tarifas de uso de modelos de Gemini por separado.
Imagen
Con Imagen en Vertex AI, puedes generar imágenes nuevas y editar imágenes según las instrucciones de texto que proporciones, o editar solo partes de imágenes mediante un área de máscara que definas junto con muchas otras capacidades.
Modelo | Función | Descripción | Entrada | Resultado | Precio |
---|---|---|---|---|---|
Imagen 4 Ultra | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.06 por imagen |
Imagen 4 | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.04 por imagen |
Imagen 4 Fast | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.02 por imagen |
Imagen 3 | Generación de imágenes | Generar una imagen Editar una imagen Personalizar una imagen |
Instrucción de texto | Imagen | $0.04 por imagen |
Imagen 3: Rápido | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.02 por imagen |
Imagen 2, Imagen | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.020 por imagen |
Edición de imágenes | Edita una imagen con el enfoque “máscara” o “sin máscara” | Instrucción de imagen/texto | Imagen | $0.020 por imagen | |
Mejora de la resolución | Aumenta la resolución de una imagen generada a 2k y 4k | Imagen | Imagen | $0.003 por imagen | |
Ajuste | Habilita un "asunto" proporcionado por el usuario para usarlo en instrucciones de Imagen (entrenamiento de pocas tomas) | Asuntos con identificador de texto y 4 a 8 imágenes por sujeto | Modelo preciso (después del entrenamiento con sujetos proporcionados por el usuario) | $ por hora de procesamiento de nodo (precios de entrenamiento personalizado de Vertex AI) | |
Subtítulos visuales | Genera una leyenda de texto corta o larga para una imagen | Imagen | Leyenda de texto | $0.0015/imagen | |
Preguntas y respuestas visuales | Proporciona una respuesta basada en una pregunta que haga referencia a una imagen | Instrucción de imagen/texto | Respuesta de texto | $0.0015/imagen |
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.
Veo
Veo 2 crea videos de una calidad increíblemente alta en una amplia gama de temas y estilos, lo que permite comprender mejor la física del mundo real y los matices del movimiento y la expresión humanos.
Modelo | Función | Descripción | Entrada | Salida | Precio |
---|---|---|---|---|---|
Veo 3 | Generación de video | Generar videos a partir de una instrucción de texto o una imagen de referencia | Instrucción de texto/imagen | Video | $0.50 por segundo |
Veo 3 | Generación de video y audio | Generar videos con efectos de voz y sonido sincronizados a partir de una instrucción de texto o una imagen de referencia | Instrucción de texto/imagen | Video y audio | $0.75/segundo |
Veo 2 | Generación de video | Generar videos a partir de una instrucción de texto o una imagen de referencia | Instrucción de texto/imagen | Video | $0.50 por segundo |
Veo 2 | Controles avanzados | Generar videos a través de la interpolación de fotogramas de inicio y finalización, extender videos generados y aplicar controles de cámara | Instrucción de texto/imagen/video | Video | $0.50 por segundo |
Lyria
Lyria 2 ofrece generación de música instrumental de alta calidad que es ideal para composiciones sofisticadas y una exploración creativa detallada en la que la salida con matices es clave.
Modelo | Función | Descripción | Entrada | Salida | Precio |
---|---|---|---|---|---|
Lyria 2 | Generación de música | Generar música a partir de una instrucción de texto | Instrucción de texto | Música | $0.06 por 30 segundos |
Comprender los costos de incorporación para tus aplicaciones de IA
Modelo | Tipo | Región | Precio por 1,000 tokens de entrada |
---|---|---|---|
Incorporación de Gemini | Entrada | Global |
|
Salida | Global |
|
Modelo | Tipo | Región | Precio por 1,000 caracteres |
---|---|---|---|
Incorporaciones para texto (Excluyendo la incorporación de Gemini) |
Entrada | Global |
|
Salida | Global |
|
Modelo | Función | Descripción | Entrada | Resultado | Precio |
---|---|---|---|---|---|
multimodalembedding | Incorporaciones para multimodales: texto | Genera incorporaciones con texto como entrada | Texto | Incorporaciones | $0.0002 / 1,000 caracteres de entrada |
Incorporaciones para multimodales: imagen | Genera incorporaciones con imagen como entrada | Imagen | Incorporaciones | $0.0001 / imagen de entrada | |
Incorporaciones para multimodales: video plus | Video Plus | Video | Incorporaciones (hasta 15 incorporaciones por minuto de video) | $0.0020 por segundo de video | |
Incorporaciones para multimodales: Estándar de video | Video Standard | Video | Incorporaciones (hasta 8 incorporaciones por minuto de video) | $0.0010 por segundo de video | |
Incorporaciones para multimodales: elementos esenciales de video | Video Essential | Video | Incorporaciones (hasta 4 incorporaciones por minuto de video) | $0.0005 por segundo de video |
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.
Precios de la finalización de código de Vertex AI
La asistencia de IA generativa en Vertex AI cobra por cada 1,000 caracteres de entrada (mensaje) y cada 1,000 caracteres de salida (respuesta). Los caracteres se cuentan mediante puntos de código UTF-8 y el espacio en blanco se excluye del recuento. Durante la etapa de vista previa, los cargos tienen un 100% de descuento. Las solicitudes de predicción que generan respuestas filtradas se cobran solo por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo ($0.01) se redondean a un centavo.
Modelo | Tipo | Región | Precio por 1,000 caracteres |
---|---|---|---|
Codey para completar código | Entrada | Global |
|
Salida | Global |
|
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.
Traducción (texto)
Usar la API de Vertex AI y el LLM de Translation para traducir texto Las traducciones de los LLM suelen ser más fluidas y sonar más humanas que las de los modelos de traducción clásicos, pero tienen una compatibilidad con el idioma más limitada (Más información).
Modelo | Método | Uso | Precio por millón de caracteres |
---|---|---|---|
LLM | Traducción de texto* | La cantidad de caracteres de entrada por mes |
$10 por millón de caracteres* |
La cantidad de caracteres de salida por mes |
$10 por millón de caracteres* |
Los precios aparecen en dólares estadounidenses.
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* El precio se calcula por carácter procesado por el modelo. Consulta Caracteres que se cobran
para obtener más detalles sobre los caracteres que se consideran en el precio.
Optimiza los costos con el almacenamiento en caché de contexto de Vertex AI
Con el almacenamiento en caché del contexto, puedes reducir el costo del procesamiento de tokens de entrada de Gemini en un 75% y la latencia de la generación de contenido almacenando en caché la parte del contexto de tu texto de entrada o contenido multimedia en los modelos de Gemini. La cantidad de tiempo que los datos se almacenan en la caché, que puede controlar el usuario, determina los cargos de “Almacenamiento de caché de contexto”. Cuando se crea un contexto en caché, se les cobrará a los usuarios el costo estándar del token de entrada. Los aciertos de caché en los datos de entrada se cobran a una tarifa reducida, “Entrada almacenada en caché”, en lugar del costo de entrada normal. El tamaño de los datos para el almacenamiento y la entrada se calcula de la misma manera que el precio de la entrada de Gemini.
Modelos de Gemini 2.5
Modelo | Atributo | Tipo | Precio (/1 millón de tokens) <= 200,000 tokens de entrada |
Precio (/1M tokens) > 200,000 tokens de entrada |
---|---|---|---|---|
Gemini 2.5 Pro | Entrada almacenada en caché | Entrada (texto, imagen, video, audio) | $0.31 (/1 millón de tokens) | USD 0.625 (/1 millón de tokens) |
Salida | N/A | N/A | ||
Almacenamiento de caché de contexto | Entrada (texto, imagen, video, audio) | $4.5 (/M Tok/h) | $4.5 (/M Tok/h) | |
Gemini 2.5 Flash | Entrada almacenada en caché | Entrada (texto, imagen, video, audio) | $0.0375 (/1 millón de tokens) | $0.0375 (/1 millón de tokens) |
Salida | N/A | N/A | ||
Almacenamiento de caché de contexto | Entrada (texto, imagen, video, audio) | USD 1 (/M Tok/h) | USD 1 (/M Tok/h) |
Modelos de Gemini 2.0
Precios basados en tokens
Modelo |
Tipo |
Almacenamiento (M tok-hour) |
Precio |
---|---|---|---|
Gemini 2.0 Flash |
|||
1 millón de tokens de entrada | $1.00 | $0.0375 | |
1 millón de tokens de entrada de audio | $1.00 | $0.25 | |
1 millón de tokens de texto de salida | N/A | N/A | |
Gemini 2.0 Flash Lite |
|||
1 millón de tokens de entrada | $1.00 | $0.01875 | |
1 millón de tokens de entrada de audio | $1.00 | $0.01875 | |
1 millón de tokens de texto de salida | N/A | N/A |
Precios basados en modalidades
Los precios de las modalidades que se indican a continuación se basan en casos de uso promedio solo como referencia. La facturación real solo se basará en tokens:
- 4 caracteres dan como resultado aproximadamente 1 token de texto, incluidos los espacios en blanco.
- Para una imagen de 1024 x 1024, consume 1,290 tokens. El recuento de tokens por imagen varía según la resolución de la imagen. Para obtener más información sobre cómo calcular los tokens, puedes consultar nuestra documentación.
- La entrada de video consume 258 tokens por segundo a una velocidad de muestreo de un fotograma por segundo. El video con audio factura tanto los tokens de video como los tokens de audio.
- La entrada de audio consume 25 tokens por segundo sin marca de tiempo.
Modelo |
Tipo |
Almacenamiento (modalidad-hora) |
Precio |
---|---|---|---|
Gemini 2.0 Flash |
|||
Texto de entrada (caracteres $/M) | $0.25 | $0.009375 | |
Imagen de entrada ($/image) | $0.00129 | $0.000048375 | |
Video de entrada (USD/s) | $0.000258 | $0.000009675 | |
Audio de entrada ($/s) | $0.000025 | $0.00000625 | |
Texto de salida (caracteres $/M) | N/A | N/A | |
Gemini 2.0 Flash Lite |
|||
Texto de entrada (caracteres $/M) | $0.25 | $0.0046875 | |
Imagen de entrada ($/image) | $0.00129 | $0.0000241875 | |
Video de entrada (USD/s) | $0.000258 | $0.000009675 | |
Audio de entrada ($/s) | $0.000258 | $0.0000048375 | |
Texto de salida (caracteres $/M) | N/A | N/A | |
Grounding with Google Search |
Gemini 2.0 Flash incluye hasta 1,500 solicitudes de verificación de datos por día sin cargo adicional. Las solicitudes de conexión a tierra que superen las 1,500 por día se facturan a USD 35 por cada 1,000 solicitudes (hasta 1 millón de solicitudes por día). Si necesitas más de 1 millón de solicitudes por día, comunícate con tu equipo de cuentas. |
||
Protección contra la Web para empresas |
$45 por cada 1,000 solicitudes (hasta 1 millón de solicitudes por día) a partir del 5 de mayo de 2025. Si necesitas más de 1 millón de solicitudes por día, comunícate con tu equipo de cuentas. |
* Los precios aparecen en dólares estadounidenses (USD).
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* Los PDF se facturan como entrada de imagen, con una página de PDF equivalente a una imagen.
* El extremo del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La vinculación con la Búsqueda de Google solo se factura por las solicitudes que devuelven resultados que contienen al menos una URL de asistencia de vinculación de la Web. También se aplican las tarifas de uso del modelo Gemini estándar.
Capacidad de procesamiento aprovisionada
La capacidad de procesamiento aprovisionada garantiza la capacidad de procesamiento para tus necesidades de IA generativa y se realiza a través de unidades de escala de IA generativa, o GSU. Obtén más información sobre la capacidad de procesamiento que proporciona cada GSU aquí y usa nuestro estimador en línea aquí.
Duración | Precio por GSU | Por |
---|---|---|
1 confirmación de la semana | USD 1,200 | Semana |
Compromiso de 1 mes | USD 2,700 | Mes |
Compromiso de 3 meses | USD 2,400 | Mes |
Compromiso por 1 año | $2,000 | Mes |
Ejemplo de cálculo de costos
Un usuario necesita asegurarse de que puede admitir 10 consultas por segundo (QPS) de una consulta con una entrada de 1,000 tokens de texto y 500 tokens de audio, y recibir un resultado de 300 tokens de texto con gemini-2.0-flash.
Con la tabla de rendimiento y tasa de consumo, sabemos que la tasa de consumo de un token de texto de entrada es de 1 token, la tasa de consumo de un token de audio de entrada es de 7 tokens y la tasa de consumo de un token de texto de salida es de 4 tokens.
El total de tokens de entrada del usuario es 1,000* (1 token por token de texto de entrada) + 500* (7 tokens por token de audio de entrada) = 4,500 tokens de entrada ajustados de burndown. El total de tokens de salida del usuario es 300* (4 tokens por token de texto de salida) = 1,200 tokens de salida ajustados de burndown. Si los sumamos, obtenemos 4,500 tokens de entrada ajustados por burndown + 1,200 tokens de salida ajustados por burndown = 5,700 tokens en total por consulta.
Si multiplicamos los tokens totales por consulta por las QPS, obtenemos 5,700 tokens totales por consulta * 10 QPS = 57,000 tokens totales por segundo.
Si dividimos esto por la capacidad de procesamiento total por segundo por GSU, obtenemos 57,000 tokens totales por segundo ÷ 3,360 de capacidad de procesamiento por segundo por GSU = 16.96 GSU. El incremento mínimo de compra de GSU para este modelo es de 1, por lo que el usuario necesitaría 17 GSU.
Si el usuario quisiera mantener esta capacidad de procesamiento durante 1 semana, le costaría $1,200 * 17 GSUs = $20,400 por semana. Si quisieran mantener esta capacidad de procesamiento durante 1 mes, les costaría $2,700 * 17 GSU = $45,900 por mes. Si quisieran mantener esta capacidad de procesamiento durante 3 meses, el costo sería de $2,400 * 17 GSU = $40,800 por mes. Por último, si quisieran mantener esta capacidad de procesamiento durante 1 año, el costo sería de $2,000 * 17 GSU = $34,000 por mes.
Compara los precios de los modelos de socios en Vertex AI
Los modelos de socios son una lista seleccionada de modelos de IA generativa que desarrollan los socios de Google. Los modelos de socios se ofrecen como APIs administradas. Para obtener más información, consulta Descripción general de los modelos de socios. En las siguientes secciones, se enumeran los detalles de precios para los modelos de socios de Google.
Modelos de AI21 Labs
Modelo | Precios |
---|---|
Jamba 1.5 Large | Entrada: $2 por millón de tokens Salida: $8 por millón de tokens |
Jamba 1.5 Mini | Entrada: $0.20 por cada millón de tokens Salida: $0.40 por cada millón de tokens |
Modelos Claude de Anthropic
Modelo | Precios |
---|---|
Claude Opus 4 | Entrada: $15 / millón de tokens Salida: $75 / millón de tokens Entrada por lotes: $7.50 / millón de tokens Salida por lotes: $37.50 / millón de tokens Escritura en caché: $18.75 / millón de tokens Acceso a la caché: $1.50 / millón de tokens Escritura en caché por lotes: $9.375 / millón de tokens Acceso a la caché por lotes: $0.75 / millón de tokens |
Claude Sonnet 4 | Entrada: $3 / millón de tokens Salida: $15 / millón de tokens Entrada por lotes: $1.50 / millón de tokens Salida por lotes: $7.50 / millón de tokens Escritura en caché: $3.75 / millón de tokens Acceso a la caché: $0.30 / millón de tokens Escritura en caché por lotes: $1.875 / millón de tokens Acceso a la caché por lotes: $0.15 / millón de tokens |
Claude 3.7 Sonnet | Entrada: $3 / millón de tokens Salida: $15 / millón de tokens Entrada por lotes: $1.50 / millón de tokens Salida por lotes: $7.50 / millón de tokens Escritura en caché: $3.75 / millón de tokens Acceso a la caché: $0.30 / millón de tokens Escritura en caché por lotes: $1.875 / millón de tokens Acceso a la caché por lotes: $0.15 / millón de tokens |
Claude 3.5 Haiku | Entrada: $0.80 / millón de tokens Salida: $4 / millón de tokens Entrada por lotes: $0.40 / millón de tokens Salida por lotes: $2 / millón de tokens Escritura en caché: $1 / millón de tokens Acceso a la caché: $0.08 / millón de tokens Escritura en caché por lotes: $0.50 / millón de tokens Acceso a la caché por lotes: $0.04 / millón de tokens |
Claude 3.5 Sonnet v2 | Entrada: $3 / millón de tokens Salida: $15 / millón de tokens Entrada por lotes: $1.50 / millón de tokens Salida por lotes: $7.50 / millón de tokens Escritura en caché: $3.75 / millón de tokens Acceso a la caché: $0.30 / millón de tokens Escritura en caché por lotes: $1.875 / millón de tokens Acceso a la caché por lotes: $0.15 / millón de tokens |
Claude 3.5 Sonnet | Entrada: $3 / millón de tokens Salida: $15 / millón de tokens Escritura en caché: $3.75 / millón de tokens Tiro correcto en la caché: $0.30 / millón de tokens |
Claude 3 Haiku | Entrada: $0.25 / millón de tokens Salida: $1.25 / millón de tokens Escritura en caché: $0.30 / millón de tokens Tiro correcto en la caché: $0.03 / millón de tokens |
Claude 3 Sonnet (deprecated) | Entrada: $3 por millón de tokens Salida: $15 por millón de tokens |
Claude 3 Opus | Entrada: $15 por millón de tokens Salida: $75 por millón de tokens Escritura en caché: $18.75 por millón de tokens Acceso a la caché: $1.50 por millón de tokens |
Modelos Llama de Meta
Modelo | Precios |
---|---|
Llama 3.1 405b | Entrada: $5.00 / millón de tokens Salida: $16.00 / millón de tokens |
Llama 3.3 70B * | Entrada: $0.72 por millón de tokens Salida: $0.72 por millón de tokens |
Scout de Llama 4 * | Entrada: $0.25 por millón de tokens Salida: $0.70 por millón de tokens |
Llama 4 Maverick * | Entrada: $0.35 por millón de tokens Salida: $1.15 por millón de tokens |
- Disponible sin cargo hasta el 1 de mayo de 2025.
Modelos de Mistral AI
Modelo | Precios |
---|---|
OCR de Mistral (25.05) | Entrada: $0.0005 / millón de tokens (o $0.0005/página) Salida: $0.0005 / millón de tokens (o $0.0005/página) |
Mistral Small 3.1 (25.03) | Entrada: $0.10 / millón de tokens Salida: $0.30 / millón de tokens |
Mistral grande (24.11) | Entrada: $2.00 por millón de tokens Salida: $6.00 por millón de tokens |
Mistral Nemo | Entrada: $0.15 por cada millón de tokens Salida: $0.15 por cada millón de tokens |
Codestral (25.01) | Entrada: $0.30 por millón de tokens Salida: $0.90 por millón de tokens |