Vertex AI Agent Engine(旧称 LangChain on Vertex AI、Vertex AI Reasoning Engine)は、デベロッパーが本番環境で AI エージェントをデプロイ、管理、スケーリングできるようにするフルマネージド サービスです。 Google Cloud Agent Engine は、本番環境でエージェントをスケーリングするためのインフラストラクチャを処理するため、インテリジェントで効果的なアプリケーションの作成に集中できます。Vertex AI Agent Engine は、次の機能を提供します。
フルマネージド: VPC-SC コンプライアンスや包括的なエンドツーエンドの管理機能など、堅牢なセキュリティ機能を提供するマネージド ランタイムを使用して、エージェントをデプロイしてスケーリングします。パフォーマンス モニタリングとトレースに Google Cloud Trace(OpenTelemetry をサポート)を使用するマルチエージェント アプリケーションへの CRUD アクセス権を取得します。詳細については、エージェントをデプロイするをご覧ください。
品質と評価: 統合された Gen AI Evaluation Service でエージェントの品質を確保します。
開発の簡素化: Vertex AI Agent Engine は、アプリケーション サーバー開発、認証と IAM の構成などの低レベルのタスクを抽象化するため、エージェントの動作、ツール、モデル パラメータなどのエージェントの独自の機能に集中できます。さらに、エージェントは Vertex AI の任意のモデルとツール(関数呼び出しなど)を使用できます。
フレームワークに依存しない: LangGraph、Langchain、AG2、CrewAI など、さまざまな Python フレームワークを使用して構築したエージェントを柔軟にデプロイできます。既存のエージェントがある場合は、SDK のカスタム テンプレートを使用して、Vertex AI エージェント エンジンで実行するようにエージェントを適応させることができます。それ以外の場合は、Google が提供するフレームワーク固有のテンプレートのいずれかを使用して、エージェントをゼロから開発できます。
Vertex AI Agent Engine で作成してデプロイする
注: Vertex AI Agent Engine でIDE ベースの開発とデプロイを効率的に行うには、agent-starter-pack を検討してください。すぐに使用できるテンプレートと、テスト用の組み込み UI が用意されており、デプロイ、運用、評価、カスタマイズ、オブザーバビリティを簡素化します。
Vertex AI Agent Engine でエージェントを構築するワークフローは次のとおりです。
手順 | 説明 |
---|---|
1. 環境を設定する | Google プロジェクトを設定し、最新バージョンの Vertex AI SDK for Python をインストールします。 |
2. エージェントを開発する | Vertex AI Agent Engine にデプロイできるエージェントを開発します。 |
3. エージェントをデプロイする | Vertex AI Agent Engine マネージド ランタイムにエージェントをデプロイします。 |
4. エージェントを使用する | API リクエストを送信してエージェントにクエリを実行します。 |
5. デプロイされたエージェントを管理する | Vertex AI Agent Engine にデプロイしたエージェントを管理、削除します。 |
次の図は、このプロセスを示しています。
ユースケース
エンドツーエンドの例を使用して Vertex AI Agent Engine の詳細を確認するには、次のリソースをご覧ください。
エンタープライズ セキュリティ
Vertex AI Agent Engine は VPC Service Controls をサポートしており、データのセキュリティを強化し、データ漏洩のリスクを軽減します。VPC Service Controls が構成されている場合、デプロイされたエージェントは、BigQuery API、Cloud SQL Admin API、Vertex AI API などの Google API とサービスへの安全なアクセスを維持し、定義された境界内でシームレスに動作します。重要な点として、VPC Service Controls はすべての公共のインターネット アクセスを効果的にブロックし、データの移動を承認済みのネットワーク境界内に限定することで、企業のセキュリティ体制を大幅に強化します。
サポートされているリージョン
Vertex AI Agent Engine は、次のリージョンでサポートされています。
地域 | ロケーション | 説明 | リリース ステージ |
---|---|---|---|
us-central1 |
アイオワ | v1 バージョンと v1beta1 バージョンがサポートされています。 |
GA |
us-west1 |
オレゴン | v1 バージョンと v1beta1 バージョンがサポートされています。 |
GA |
europe-west1 |
ベルギー | v1 バージョンと v1beta1 バージョンがサポートされています。 |
GA |
europe-southwest1 |
マドリッド | v1 バージョンと v1beta1 バージョンがサポートされています。 |
GA |
asia-east1 |
台湾 | v1 バージョンと v1beta1 バージョンがサポートされています。 |
GA |
asia-northeast1 |
東京 | v1 バージョンと v1beta1 バージョンがサポートされています。 |
GA |
割り当て
各リージョンの特定のプロジェクトの Vertex AI Agent Engine には、次の割り当てと上限が適用されます。割り当て | 値 |
---|---|
1 分あたりの Vertex AI Agent Engine の作成/削除/更新回数 | 10 |
1 分あたりの Vertex AI エージェント エンジンのクエリ/ストリーム クエリ | 60 |
Vertex AI Agent Engine リソースの最大数 | 100 |
料金
料金は、Vertex AI Agent Engine マネージド ランタイムにデプロイされたエージェントによって使用されるコンピューティング(vCPU 時間)とメモリ(GiB 時間)のリソースに基づいています。
プロダクト | SKU ID | 価格 |
---|---|---|
ReasoningEngine vCPU | 8A55-0B95-B7DC | $0.0994/vCPU-Hr |
ReasoningEngine メモリ | 0B45-6103-6EC1 | $0.0105/GiB-Hr |
詳細は、料金をご覧ください。