Preços dos aplicativos de IA

Os preços são indicados em dólares americanos (US$).

Os preços dos recursos em disponibilidade geral (GA) listados serão aplicados a partir de 1º de setembro de 2023.

O AI Applications permite que os desenvolvedores, mesmo aqueles com habilidades limitadas de machine learning, aproveitem o poder dos modelos de linguagem grandes de fundação, da experiência em pesquisa e das tecnologias de IA de conversação do Google para criar aplicativos de IA generativa de nível empresarial

Créditos do teste e suporte

US$ 1.000 em créditos de teste GRÁTIS para uso com aplicativos de IA. Os créditos são válidos por um ano a partir da inscrição da conta no AI Applications, a partir de 18 de julho de 2023.

Tem dúvidas sobre a funcionalidade do GA ou sobre a definição de pacotes e preços dos recursos de visualização?

Entre em contato com a equipe de Google Cloud vendas para mais informações.

Preços da Vertex AI para Pesquisa

Os aplicativos de IA permitem criar rapidamente mecanismos de pesquisa para sites, dados não estruturados e dados estruturados para recuperar informações e gerar respostas fundamentadas. Saiba mais sobre os recursos disponíveis na Vertex AI para Pesquisa.

Preços da funcionalidade de lançamento gradual da Vertex AI para Pesquisa

Teste gratuito: você terá acesso a 10.000 consultas por conta todo mês sem custo financeiro para conhecer o Vertex AI para Pesquisa sem um investimento inicial. Exclui respostas generativas avançadas.

Edição Standard da Pesquisa US$ 1,50 / 1.000 consultas
A edição Enterprise do Search
inclui as principais respostas generativas (modo IA)
US$ 4,00 / 1.000 consulta
Respostas generativas avançadas (Modo IA)
(pode ser adicionado à Standard Edition e à Enterprise Edition)
+US$4,00 / 1.000 consulta de entrada do usuário
Search Standard Edition: recursos de pesquisa não estruturada + pesquisa estruturada
Search Enterprise Edition: recursos de pesquisa não estruturada + pesquisa estruturada + pesquisa de sites

A Vertex AI para Pesquisa Enterprise Edition inclui as principais respostas generativas (modo IA). Forneça respostas, resumos e acompanhamentos sem custo financeiro adicional. Observação: as principais respostas generativas não incluem acompanhamentos sugeridos, multimodalidade, tratamento de consultas complexas e longas nem tratamento de consultas complexas.

As respostas generativas avançadas incluem recursos avançados, como acompanhamentos sugeridos, tratamento de consultas complexas e multimodalidade.

Pesquisa: o faturamento é medido por solicitação ou entrada de consulta individual
Uma solicitação ou consulta é definida como qualquer chamada de API para a Pesquisa empresarial, seja direta com o uso da API ou indireta com o uso da integração ou do console.
Por exemplo, quando um usuário faz uma pergunta em linguagem natural e o mecanismo de pesquisa responde, isso é uma consulta.

As respostas generativas avançadas (Modo IA) são adicionadas a uma consulta para aprimorar o processamento e usar um recurso de IA generativa.
As respostas generativas avançadas (Modo IA) podem ser usadas de forma intercambiável com o Search Standard Edition ou o Search Enterprise Edition.
Exemplo: executar uma consulta do Search Enterprise com uma solicitação multimodal = 1 consulta do Search Enterprise + 1 consulta de respostas generativas avançadas (Modo IA)

Exemplo de preço para a funcionalidade GA da Vertex AI para Pesquisa

Exemplo de dados não estruturados : pesquisa de documentos

Suposição:

  • 10 milhões de consultas na Standard Edition por ano
  • 10 milhões de consultas da edição Enterprise com 2 milhões de respostas generativas avançadas (Modo IA) por ano
  • 100 mil documentos com ~1 MB cada
Volume de SKU Taxa Preço de tabela total
Pesquisa padrão
10 milhões/ano (com 10 mil teste gratuito) * US$ 1,50 / 1.000 consultas = US$ 14.985
Search Enterprise com respostas generativas básicas (modo IA)
10 milhões/ano (com 10 mil teste gratuito) * US$ 4,00 / 1.000 consultas = US$ 39.960
Respostas generativas avançadas (Modo IA)
Cada consulta adicionada a uma consulta Standard ou Enterprise
2 milhões/ano * +US$4,00 / 1.000 consultas de entrada de usuário = Mais de US$8.000
Dados indexados
100 GB por ano 10 GB gratuitos, então 90 GB usados na cálculo de preço * US$ 5,00 / GB * 12 meses = US$ 5.400

Preços do armazenamento de índices

Preços do armazenamento de dados de índice de aplicativos de IA

Armazenamento de índice US$ 5,00 / GiB de dados brutos por mês
* Cota gratuita de 10 GiB por mês
** Compartilhado entre aplicativos de IA
***O custo do armazenamento de índice é aplicado ao tamanho total dos dados brutos, amostrados regularmente e calculados como uma média para o mês. As operações de atualização dos dados não resultam em custos adicionais.
**** Para o Google Cloud Storage, o armazenamento é calculado como 500 kibibytes (KiB) * "número de páginas no site", em que 1 KiB é igual a 1.024 bytes. (500 KiB é ~0,000477 GiB; portanto, a indexação de dados preço para um site com 1.000 páginas é US $2,38 ao mês.)

Preços da Vertex AI para Pesquisa no setor de saúde

A Vertex AI para Pesquisa na área da saúde permite criar rapidamente mecanismos de pesquisa ajustados para a medicina com base em dados de saúde.

Pesquisa de saúde US$ 20,00 / 1.000 consulta

A Vertex AI para Pesquisa na Saúde inclui alguns recursos em visualização prévia, como respostas de IA generativa, atualizações de streaming no índice e outros. Esses recursos podem ter preços diferentes do valor listado atualmente quando forem lançados para disponibilidade geral.

Suposição:

  • 1.000.000 solicitações de pesquisa de saúde por mês

  • 1.000 GiB de dados de saúde indexados

Volume de SKU Taxa Preço de tabela total
1.000.000 pesquisas US$ 20/1.000 US$ 20.000
1.000 GiB US$ 5/GiB US$ 5.000

Preços da Vertex AI para Pesquisa em mídia

Com a Vertex AI para mídia, você pode oferecer resultados de vídeo altamente relevantes, aproveitando a consulta e o entendimento contextual do Google para melhorar a descoberta no seu site de mídia.

Aplicações de IA: índice de dados US$ 5,00 / GB por mês
Vertex AI para Pesquisa: contagem de solicitações da API Media Search US$ 2,00 / 1.000 consultas

Preços da Vertex AI para Pesquisa em Recomendações de mídia

As únicas operações do Media Recommendations que geram cobranças são treinar, ajustar ou solicitar previsões chamando o método recommend. Não há custo para importar ou gerenciar eventos do usuário ou informações de documentos.

Os custos de treinamento (nós por hora) serão cobrados diariamente se o modelo estiver treinando ativamente ou se você tiver enviado uma solicitação para retomar o treinamento. Depois que você pausar ou excluir um modelo, não haverá mais cobranças. Consulte a documentação sobre como gerenciar treinamentos.

Os custos de ajuste (nós por hora) para modelos ativos são cobrados depois que o ajuste é concluído. Você só será cobrado por um ajuste incompleto se pausar ou excluir um modelo durante um ajuste em andamento. Nesse caso, você será cobrado pelas horas de uso do nó consumidas antes do ajuste do modelo ser interrompido. Consulte a documentação sobre como gerenciar ajustes.

Solicitações de previsão por mês Preço por 1.000 previsões
Até 20.000.000 US$ 0,27
Próximos 280.000.000 US$ 0,18
Após 300.000.000 US$ 0,10
Recurso Preço
Treinamento e ajuste US$ 2,50 por nó/hora

Exemplo de preço para recomendações de mídia

Suposição:

  • 1.000.000.000 solicitações de previsão por mês

  • Treina um modelo por dia, que faz novo treino automaticamente uma vez por dia

  • equivale a aproximadamente 500 horas de uso do nó com treinamento de modelo e 100 horas de ajuste de modelo por mês

Volume de SKU Taxa Preço de tabela total
Primeiros 20 milhões de previsões * US$ 0,27 / 1.000 previsões = US$ 5.400
Próximas 280 milhões de previsões * US$ 0,18 / 1.000 previsões = US$ 50.400
Próximas 700 milhões de previsões * US$ 0,10 / 1.000 previsões = US$ 70.000
500 horas de uso de nós (Treinamento) * US$ 2,50 / hora = US$ 1.250
100 horas de uso de nós (ajuste) * US$ 2,50 / hora = US$ 250,00
Total US$ 127.300

Cobranças do Google Cloud Observability

O Media Recommendations registra um erro na Observability do Google Cloud para cada solicitação de API que resulta em um erro, como uma solicitação de evento do usuário que contém JSON malformado ou uma solicitação de importação de documento com um preço negativo. O Media Recommendations também registra um erro para cada solicitação de previsão com um documento que não está no datastore importado.

O Google Cloud Observability cobra pelo GiB de registros armazenados e pela retenção além do período de armazenamento padrão. Para detalhes sobre a cota gratuita e a retenção de dados, consulte a página de preços do Google Cloud Observability.

O tamanho dos dados de criação de registros depende do payload JSON, mas um GiB seria de aproximadamente 200.000 erros do Media Recommendations.

Preços da API Grounded Generation

A API Grounded Generation permite criar respostas generativas para seus prompts usando informações da Pesquisa Google ou seus próprios dados.

Comando de entrada (inclui comando do usuário, instruções do sistema e informações básicas inline) Cobrança pelo preço do modelo do Gemini selecionado.
Saída Cobrança pelo preço do modelo do Gemini selecionado.
Geração com embasamento para usar seus próprios dados recuperados US$ 2,50 / 1.000 solicitações
Geração com embasamento para embasamento na Pesquisa Google Consulte Embasamento na Pesquisa Google.
Os custos adicionais para recuperação de dados são determinados pelo sistema de recuperação selecionado (por exemplo, Vertex AI para Pesquisa).

Exemplo 1: fundamentação na Vertex AI para Pesquisa e fatos de fundamentação inline

O usuário usa a Vertex AI para Pesquisa e outros fatos para gerar respostas fundamentadas. Cada comando de entrada tem 2.500 caracteres (incluindo fatos de fundamentação inline) e cada comando de saída tem 200 caracteres. O usuário selecionou o Gemini 1.5 Flash.

Volume por solicitação Preço por mil solicitações
Comando de entrada 2.500 caracteres 1.000 solicitações * US$ 0,000125 por 1.000 caracteres * 2.500 caracteres por solicitação = US$0,3125 por 1.000 solicitações
Saída 200 caracteres 1.000 solicitações * US$ 0,000375 por 1.000 caracteres * 2 caracteres por solicitação = US$0,075 por 1.000 solicitações
Geração com embasamento para usar seus próprios dados recuperados 1 solicitação US$2,50 por 1.000 solicitações
Recuperação de dados: Vertex AI para Pesquisa (edição Enterprise) 1 solicitação US$4,00 por 1.000 solicitações
Total: US$ 6,8875 por 1.000 solicitações

O usuário usa a Pesquisa Google para gerar respostas fundamentadas. Cada comando de entrada tem 500 caracteres e cada comando de saída tem 200 caracteres. O usuário selecionou o Gemini 1.5 Flash.

Volume por solicitação Preço por mil solicitações
Comando de entrada 500 caracteres 1.000 solicitações * US$ 0,000125 por 1.000 caracteres * 500 caracteres por solicitação = US$0,0625 por 1.000 solicitações
Saída 200 caracteres 1.000 solicitações * US$ 0,000375 por 1.000 caracteres * 200 caracteres por solicitação = US$0,075 por 1.000 solicitações
Geração com embasamento para embasamento na Pesquisa Google 1 solicitação US$35,00 por 1.000 solicitações
Total: US$ 35,1375 por 1.000 solicitações

Confira os preços da API Grounding

A verificação do embasamento permite determinar o embasamento de um texto (a resposta candidata) em um conjunto de textos de referência (os fatos).

Verificar embasamento US$ 0,00075 por 1.000 caracteres de resposta

Preços dos recursos da Document AI

Para informações completas sobre os preços de todos os recursos da Document AI, consulte a página de preços da Document AI.

Para os recursos da Document AI integrados e faturados pela Vertex AI para Pesquisa, consulte as tabelas abaixo.

Digitalizar texto

Processador 1 a 5.000.000 páginas/mês * A partir de 5.000.001 páginas/mês
Processador de OCR de documentos corporativo US$ 1,50 a cada 1.000 páginas US$ 0,60 por 1.000 páginas

Extraia estruturas e entidades de documentos

Analisador de layout (inclui o agrupamento inicial) US$ 10 por 1.000 páginas

*O tamanho de uma página depende do formato do arquivo.

  • Imagens (JPEG/JPG, PNG, BMP, HEIF): cada imagem = 1 página

  • PDF: cada página no PDF = 1 página

  • TIFF: cada imagem no TIFF = 1 página

  • Word (DOCX): até 3.000 caracteres = 1 página

  • Excel (XLSX): cada guia = 1 página

  • PowerPoint (PPTX): cada slide = 1 página

  • HTML: até 3.000 caracteres = 1 página

  • Documentos analisados: até 3.000 caracteres = 1 página

Preços da API Ranking

A API de classificação recebe uma lista de documentos e os classifica novamente com base na relevância deles para uma consulta.

Em comparação com os embeddings, que consideram apenas a similaridade semântica de um documento e uma consulta, a API de classificação pode fornecer pontuações precisas sobre a qualidade de uma resposta de um documento a uma consulta específica.

A API de classificação pode ser usada para melhorar a qualidade dos resultados da pesquisa depois de recuperar um conjunto inicial de documentos candidatos.

Classificar documentos

Classificação US$ 1 por 1.000 consultas

Uma consulta é definida como tendo até 100 documentos, embora um usuário possa especificar mais de 100 documentos por consulta. No caso de mais de 100 documentos especificados, o preço aumenta em 1 para cada múltiplo de 100 documentos.
Por exemplo:

  • 132 documentos para classificar = 2 consultas

  • 200 documentos para classificar = 2 consultas

  • 399 documentos para classificar = 4 consultas

  • 401 documentos para classificar = 5 consultas

A seguir

Solicite uma cotação personalizada

Com o sistema de pagamento por uso do Google Cloud, você paga apenas pelos serviços que usa. Entre em contato com nossa equipe de vendas e receba uma cotação personalizada para sua organização.
Entre em contato