Esta página mostra o processo de configuração para acessar as APIs pré-treinadas da Vertex AI na infraestrutura isolada do Google Distributed Cloud (GDC), permitindo integrar recursos de IA ao seu aplicativo isolado. Você pode encontrar detalhes sobre os pré-requisitos e as etapas para ativar e desativar as APIs Vertex AI no console do GDC.
Esta página é destinada a desenvolvedores de aplicativos em grupos de operadores de aplicativos responsáveis por otimizar aplicativos isolados com recursos de IA. Para mais informações, consulte Públicos-alvo para documentação isolada do GDC.
A Vertex AI no Distributed Cloud inclui várias APIs que precisam ser ativadas no console do GDC para permitir que os usuários da sua organização interajam com modelos de ML e recursos de IA. Para saber mais sobre essas APIs, consulte a seguinte documentação:
- IA generativa: saiba mais sobre os recursos e modelos disponíveis de IA generativa.
- Previsão on-line: saiba mais sobre as previsões on-line.
- Reconhecimento óptico de caracteres (OCR): saiba mais sobre os recursos de reconhecimento de caracteres.
- Speech-to-Text: saiba mais sobre os recursos de reconhecimento de fala.
- Vertex AI Translation: saiba mais sobre os recursos de tradução.
- Vertex AI Workbench: saiba mais sobre o Vertex AI Workbench.
Antes de começar
Antes de começar, verifique se você concluiu as etapas de pré-requisito a seguir:
- Você precisa ter o papel de administrador da AI Platform (
ai-platform-admin
) no namespace do projeto para configurar o acesso às APIs da Vertex AI. Entre em contato com o administrador do IAM da organização ou do projeto para solicitar o papel, caso ainda não o tenha. Como alternativa, peça para o administrador ativar as APIs Vertex AI em seu nome. Para informações sobre esse papel, consulte Preparar permissões do IAM. - Configure o Sistema de Nomes de Domínio (DNS) do GDC. Se você ainda não configurou o DNS, trabalhe com seu operador de infraestrutura (IO) para concluir esse pré-requisito.
- Configure um projeto para usar a Vertex AI.
Se você trouxer seu próprio modelo porque quer usar a previsão on-line ou executar notebooks de inteligência artificial (IA) e machine learning (ML) em um ambiente de GPU, alocar máquinas de GPU para os tipos de cluster corretos.
Ativar APIs pré-treinadas
É possível ativar as APIs e os modelos de serviço da Vertex AI usando o console do GDC.
Depois de atender aos pré-requisitos, siga estas etapas para ativar as APIs:
- Faça login no console do GDC. Se você não conseguir fazer login, consulte Conectar a um provedor de identidade.
- No menu de navegação, clique em Vertex AI > APIs pré-treinadas.
Na página APIs pré-treinadas, clique em Ativar em um serviço específico para ativar essa API.
Na caixa de diálogo de confirmação, clique em Ativar. Uma mensagem de progresso é exibida.
A duração da ativação varia. Isso pode levar de 15 a 45 minutos para ser concluído, dependendo do estado do cluster.
Para conferir o status das APIs pré-treinadas, consulte o status e os endpoints do serviço.
O alerta VAI-A0001 (Enabling State Time Limit Reached
) é acionado se os
serviços demorarem muito para serem ativados. Nesse caso, sua OI precisa analisar o
runbook VAI-R0001 para mais detalhes.
Desativar APIs pré-treinadas
É possível desativar as APIs pré-treinadas usando o console do GDC.
Depois de atender aos pré-requisitos, siga estas etapas para desativar as APIs:
- Faça login no console do GDC.
- No menu de navegação, clique em Vertex AI > APIs pré-treinadas.
Na página APIs pré-treinadas, clique em Desativar em um serviço específico para desativar essa API.
Na caixa de diálogo de confirmação, digite disable no campo de texto para confirmar que você quer realizar essa ação. Depois, clique em Desativar. Uma mensagem de progresso vai aparecer.
Para conferir o status das APIs pré-treinadas, consulte o status e os endpoints do serviço.