Observe as seguintes limitações da API Reasoning Engine:
- A API Reasoning Engine oferece suporte apenas à implantação de código Python.
- A API Reasoning Engine tem suporte apenas na região
us-central1
.
Antes de começar
Antes de executar este tutorial, siga as seguintes etapas:
Criar uma instância ReasoningEngine
Para implantar o aplicativo na Vertex AI, use ReasoningEngine.create
e transmita o objeto como um parâmetro. Para introduzir dependências de pacote para
o aplicativo, use os seguintes parâmetros:
requirements
: uma lista de dependências de pacotes PyPI externos. Cada linha precisa ser uma única string. Para saber mais, consulte Formato do arquivo de requisitos.extra_packages
: uma lista de dependências de pacote internas. Essas dependências de pacote são arquivos ou diretórios locais que correspondem aos pacotes Python locais exigidos pelo aplicativo.
O código a seguir demonstra como implantar um aplicativo:
remote_app = reasoning_engines.ReasoningEngine.create(
reasoning_engines.LangchainAgent(
model=model,
tools=[get_exchange_rate],
model_kwargs=model_kwargs,
),
requirements=[
"google-cloud-aiplatform[reasoningengine,langchain]",
],
display_name="DISPLAY_NAME", # Optional.
)
remote_app
A implantação do aplicativo leva alguns minutos para ser executada. Ela cria contêineres e ativa servidores HTTP no back-end. A latência da implantação depende do tempo total necessário para instalar os pacotes necessários.
Depois de implantado, remote_app
corresponde a uma instância do reasoning_engines.LangchainAgent
que está em execução na Vertex AI e pode ser consultada ou excluída. Ela é separada das instâncias locais de reasoning_engines.LangchainAgent
.
Cada aplicativo implantado tem um identificador exclusivo. Execute o seguinte comando para receber o identificador resource_name
do seu aplicativo:
remote_app.resource_name
resource_name
tem o seguinte formato:
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID".
Práticas recomendadas
- Fixe as versões do pacote (para builds reproduzíveis). Pacotes comuns para acompanhar a inclusão:
google-cloud-aiplatform
,cloudpickle
,langchain
,langchain-core
,langchain-google-vertexai
epydantic
. - Minimize o número de dependências no seu aplicativo. Isso reduz o número de alterações interruptivas ao atualizar as dependências e facilita a atualização do aplicativo ao longo do tempo para recursos mais recentes.