Implantar o aplicativo

Observe as seguintes limitações da API Reasoning Engine:

  • A API Reasoning Engine oferece suporte apenas à implantação de código Python.
  • A API Reasoning Engine tem suporte apenas na região us-central1.

Antes de começar

Antes de executar este tutorial, siga as seguintes etapas:

  1. Configure o ambiente.
  2. Desenvolver um aplicativo.

Criar uma instância ReasoningEngine

Para implantar o aplicativo na Vertex AI, use ReasoningEngine.create e transmita o objeto como um parâmetro. Para introduzir dependências de pacote para o aplicativo, use os seguintes parâmetros:

  • requirements: uma lista de dependências de pacotes PyPI externos. Cada linha precisa ser uma única string. Para saber mais, consulte Formato do arquivo de requisitos.
  • extra_packages: uma lista de dependências de pacote internas. Essas dependências de pacote são arquivos ou diretórios locais que correspondem aos pacotes Python locais exigidos pelo aplicativo.

O código a seguir demonstra como implantar um aplicativo:

remote_app = reasoning_engines.ReasoningEngine.create(
    reasoning_engines.LangchainAgent(
        model=model,
        tools=[get_exchange_rate],
        model_kwargs=model_kwargs,
    ),
    requirements=[
        "google-cloud-aiplatform[reasoningengine,langchain]",
    ],
    display_name="DISPLAY_NAME",  # Optional.
)
remote_app

A implantação do aplicativo leva alguns minutos para ser executada. Ela cria contêineres e ativa servidores HTTP no back-end. A latência da implantação depende do tempo total necessário para instalar os pacotes necessários.

Depois de implantado, remote_app corresponde a uma instância do reasoning_engines.LangchainAgent que está em execução na Vertex AI e pode ser consultada ou excluída. Ela é separada das instâncias locais de reasoning_engines.LangchainAgent.

Cada aplicativo implantado tem um identificador exclusivo. Execute o seguinte comando para receber o identificador resource_name do seu aplicativo:

remote_app.resource_name

resource_name tem o seguinte formato: "projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID".

Práticas recomendadas

  1. Fixe as versões do pacote (para builds reproduzíveis). Pacotes comuns para acompanhar a inclusão: google-cloud-aiplatform, cloudpickle, langchain, langchain-core, langchain-google-vertexai e pydantic.
  2. Minimize o número de dependências no seu aplicativo. Isso reduz o número de alterações interruptivas ao atualizar as dependências e facilita a atualização do aplicativo ao longo do tempo para recursos mais recentes.

A seguir