Nesta página, detalhamos como implantar o GenAI Router e o servidor de modelos na organização do Gemini que você criou. Para mais informações sobre esses componentes, consulte Componentes principais.
Antes de começar
Para implantar componentes importantes na organização do Gemini, você precisa ter o seguinte:
- Substitua os flags de recursos de componentes operáveis
GEMINIeGPUna organização do Gemini. - Verifique se a organização do Gemini está funcionando.
- Carregue os pesos do modelo do Gemini na organização do Gemini.
Implantar o GenAI Router e o servidor de modelo
Para implantar o roteador de IA generativa e o servidor de modelos na organização do Gemini, siga estas etapas:
Aplique o recurso personalizado
GeminiPackageao servidor da API de gerenciamento da organização do Gemini:KUBECONFIG=GEM_ORG_MGMT_KUBECONFIG_PATH kubectl apply --kubeconfig ${KUBECONFIG:?} -f << EOF apiVersion: gemini.gdc.goog/v1 kind: GeminiPackage metadata: name: gemini-l1opr-cr namespace: gemini-system spec: applications: - name: l2crd path: gemini-l2crd - name: l2opr path: gemini-l2operator - name: genai-router path: gemini-genai-router EOFSubstitua
GEM_ORG_MGMT_KUBECONFIG_PATHpelo caminho para o arquivo kubeconfig do servidor da API de gerenciamento da organização do Gemini.Implante o recurso personalizado
ServoConfigseguindo as etapas do runbook GEMINI-R0008. Como alternativa, aplique o seguinte recurso personalizado:kubectl apply --kubeconfig ${KUBECONFIG:?} -f - << EOF apiVersion: aiplatform.gdc.goog/v1 kind: ServoConfig metadata: name: gemini-models namespace: gemini-system spec: modelCombos: - name: gemini-1.5-flash-002 replicas: 2 - name: gemini-1.5-pro-002 replicas: 1 EOF