VPC Service Controls の境界外のプライベートエンドポイントから保護されたリソースへのマルチクラウドアクセスを許可する

リファレンスアーキテクチャ

次のリファレンスアーキテクチャでは、サービスプロジェクト ph-fm-svc-project（基盤モデルサービスプロジェクト）に Gemini モデルを含む共有 VPC がデプロイされ、サービスポリシー属性により AWS から Vertex AI API へのプライベートアクセスが許可されています。

単一の VPC Service Controls 境界
プロジェクト定義のユーザー ID

VPC Service Controls を使用してサービス境界を作成するアーキテクチャ図。

省略可: アクセスレベルを作成する

エンドユーザーが Google Cloud コンソールから Vertex AI にアクセスする必要がある場合は、このセクションの手順に沿って VPC Service Controls アクセスレベルを作成します。ただし、API へのプログラムによるアクセスが限定公開のソース（プライベート Google アクセスまたは Cloud Workstations を使用したオンプレミスなど）からのものである場合、アクセスレベルは必要ありません。

このリファレンスアーキテクチャでは、企業 CIDR 範囲 corp-public-block を使用して、企業の従業員のトラフィックが Google Cloud コンソールにアクセスできるようにしています。

Access Context Manager を使用すると、 Google Cloud 組織管理者は、Google Cloudのプロジェクトとリソースに対してきめ細かい属性ベースのアクセス制御を定義できます。

アクセスレベルは、リクエストに対応するために要件を示します。次に例を示します。

デバイスの種類とオペレーティングシステム（Chrome Enterprise Premium ライセンスが必要）
IP アドレス
ユーザー ID

組織で Access Context Manager を初めて使用する場合は、管理者がアクセスポリシーを定義する必要があります。これは、アクセスレベルとサービス境界のコンテナです。

Google Cloud コンソールの上部にあるプロジェクトセレクタで、[すべて] タブをクリックし、組織を選択します。
ベーシックアクセスレベルを作成するの手順に沿って、ベーシックアクセスレベルを作成します。次のオプションを指定します。
1. [条件を作成] で、[基本モード] を選択します。
2. [アクセスレベルのタイトル] フィールドに、「corp-public-block」と入力します。
3. [条件] セクションの [条件を満たしている場合に返される値:] オプションで、[TRUE] を選択します。
4. [IP サブネットワーク] で [パブリック IP] を選択します。
5. IP アドレス範囲には、VPC Service Controls の境界へのアクセスを必要とする外部 CIDR 範囲を指定します。

VPC Service Controls のサービス境界を構築する

サービス境界を作成するときに、保護されたプロジェクトを指定することで、境界外から保護されたサービスへのアクセスを許可します。共有 VPC で VPC Service Controls を使用する場合、ホストプロジェクトとサービスプロジェクトの両方を含む大きな境界を 1 つ作成します（境界内でサービスプロジェクトのみを選択した場合、サブネットはホストプロジェクトにのみ関連付けられているため、サービスプロジェクトに属するネットワークエンドポイントは境界外にあるように見えます）。

新しい境界の構成タイプを選択する

このセクションでは、ドライランモードで VPC Service Controls のサービス境界を作成します。ドライランモードでは、境界が適用されているかのように違反がログに記録されますが、制限されたサービスへのアクセスは阻止されません。自動適用モードに切り替える前にドライランモードを使用することを、ベストプラクティスとして推奨します。

Google Cloud コンソールのナビゲーションメニューで [セキュリティ]、[VPC Service Controls] の順にクリックします。

[VPC Service Controls] ページに移動
[VPC Service Controls] ページで、[ドライランモード] をクリックします。
[新しい境界] をクリックします。
[新しい VPC サービス境界] タブの [境界名] ボックスに、境界の名前を入力します。それ以外の場合は、デフォルト値を受け入れます。

境界名の最大長は 50 文字で、先頭は英字にする必要があります。ASCII ラテン文字（a～z、A～Z）、数字（0～9）、アンダースコア（_）のみを使用できます。境界名では大文字と小文字が区別され、アクセスポリシー内で一意である必要があります。

保護するリソースを選択する

[保護するリソース] をクリックします。
境界内で保護するプロジェクトまたは VPC ネットワークを追加する手順は次のとおりです。
1. [リソースの追加] をクリックします。
2. 境界にプロジェクトを追加するには、[リソースの追加] ペインで [プロジェクトを追加] をクリックします。
  1. プロジェクトを選択するには、[プロジェクトを追加] ダイアログでプロジェクトのチェックボックスをオンにします。このリファレンスアーキテクチャでは、次のプロジェクトを選択します。
    - infra-host-project
    - aiml-host-project
    - ph-fm-svc-project
  2. [Add selected resources] をクリックします。追加されたプロジェクトが [プロジェクト] セクションに表示されます。

制限付きサービスを選択する

このリファレンスアーキテクチャでは、制限付き API のスコープが制限され、Gemini に必要な API のみが有効になります。ただし、ベストプラクティスとして、Google Cloud サービスからデータが引き出されるリスクを軽減するため、境界を作成するときはすべてのサービスを制限することをおすすめします。

境界内で保護するサービスを選択するには、以下のようにします。

[制限付きサービス] をクリックします。
[制限付きサービス] ペインで [サービスを追加] をクリックします。
[制限するサービスを指定] ダイアログで、[Vertex AI API] を選択します。
[Vertex AI API を追加] をクリックします。

省略可: VPC でアクセス可能なサービスを選択する

VPC でアクセス可能なサービスの設定は、サービス境界内のネットワークエンドポイントからアクセス可能なサービスのセットを制限します。このリファレンスアーキテクチャでは、[すべてのサービス] のデフォルト設定を維持しています。

省略可: アクセスレベルを選択する

前のセクションで企業 CIDR アクセスレベルを作成した場合は、次の操作を行って、境界の外部から保護されたリソースへのアクセスを許可します。

[アクセスレベル] をクリックします。
[アクセスレベルを選択します] ボックスをクリックします。

境界が作成された後にアクセスレベルを追加することもできます。
アクセスレベルに対応するチェックボックスをオンにします（このリファレンスアーキテクチャでは corp-public-block です）。

上り（内向き）ポリシーと下り（外向き）ポリシー

このリファレンスアーキテクチャでは、[上り（内向き）ポリシー] ペインまたは [下り（外向き）ポリシー] ペインで設定を指定する必要はありません。

境界を作成する

上記の構成手順を完了したら、[境界を作成] をクリックして境界を作成します。

AWS と Google API 間のネットワーク接続を構成する

Google API 用の Private Service Connect を構成する

プライベート Google アクセスまたは Google API のパブリックドメイン名を使用する代わりに、Private Service Connect で Google API にアクセスできます。この場合、Google がプロデューサーになります。

Private Service Connect を使用すると、次のことができます。

さまざまなユースケースで、1 つ以上の内部 IP アドレスを作成して Google API にアクセスできます。
Google API にアクセスするときに、オンプレミストラフィックを特定の IP アドレスとリージョンに転送できます。
Google API の解決に使用されるカスタムエンドポイント DNS 名を作成できます。

リファレンスアーキテクチャでは、IP アドレス 10.10.10.3, を持つ restricted という名前の Private Service Connect Google API エンドポイントがターゲット VPC-SC にデプロイされ、VPC-SC 境界で構成された制限付きサービスにアクセスするための仮想 IP（VIP）として使用されます。VIP を使用して制限されていないサービスをターゲットにすることはできません。詳細については、Vertex AI API へのアクセスについて | Google Cloud をご覧ください。

AWS VPC ネットワークを構成する

アマゾンウェブサービス（AWS）と Google Cloud間のネットワーク接続は、高可用性バーチャルプライベートネットワーク（HA VPN）トンネルを使用して確立されます。この安全な接続により、2 つのクラウド環境間のプライベート通信が容易になります。ただし、AWS のリソースと Google Cloud間のシームレスなルーティングと通信を可能にするために、Border Gateway Protocol（BGP）が使用されます。

Google Cloud 環境では、カスタムルートアドバタイズが必要です。このカスタムルートは、Private Service Connect Google API の IP アドレスを AWS ネットワークにアドバタイズします。この IP アドレスをアドバタイズすることで、AWS はパブリックインターネットをバイパスして Google API への直接ルートを確立し、パフォーマンスを向上させることができます。

リファレンスアーキテクチャでは、VPN が Google Cloudで確立されている AWS VPC との関連付けで Sagemaker インスタンスがデプロイされます。Border Gateway Protocol（BGP）は、AWS と Google Cloud ネットワーク間の HA VPN 全体でルートをアドバタイズするために使用されます。その結果、Google Cloud と AWS は VPN 経由で双方向トラフィックをルーティングできます。HA VPN 接続の設定の詳細については、 Google Cloud と AWS の間に HA VPN 接続を作成するをご覧ください。

Route 53 の更新を構成する

AWS Route 53 に p.googleapis.com という名前のプライベートホストゾーンを作成し、IP アドレス 10.10.10.3（Private Service Connect Googleapis IP）を使用して完全修飾ドメイン名 REGION-aiplatform-restricted.p.googleapis.com を DNS A レコードとして追加します。Jupyter Notebook SDK が Gemini にアクセスするために Vertex AI API の DNS ルックアップを実行すると、Route 53 は Private Service Connect Google API の IP アドレスを返します。Jupyter Notebook は、Route 53 から取得した IP アドレスを使用して、HA VPN を介して Google Cloudにルーティングされた Private Service Connect Google API エンドポイントへの接続を確立します。

SageMaker の更新を構成する

このリファレンスアーキテクチャでは、Amazon SageMaker Notebook インスタンスを使用して Vertex AI API にアクセスします。ただし、Amazon EC2 や AWS Lambda など、VPC をサポートする他のコンピューティングサービスでも同じ設定を実現できます。

リクエストを認証するには、 Google Cloud サービスアカウントキーを使用するか、Workload Identity 連携を使用します。Workload Identity 連携の設定については、オンプレミスまたは別のクラウドプロバイダをご覧ください。

Jupyter Notebook インスタンスは、カスタム Private Service Connect Google API の完全修飾ドメイン名 REGION-aiplatform-restricted.p.googleapis.com への DNS 解決を実行して、デフォルトの完全修飾ドメイン名（REGION-aiplatform.googleapis.com）をオーバーライドすることで、Google Cloud でホストされている Gemini モデルへの API 呼び出しを行います。

Vertex AI API は、Rest、gRPC、SDK を使用して呼び出すことができます。Private Service Connect の顧客の完全修飾ドメイン名を使用するには、Jupyter Notebook の API_ENDPOINT を次のように更新します。

Vertex AI SDK for Python の使用手順

SDK をインストールします。

pip install --upgrade google-cloud-aiplatform

依存関係をインポートします。

from google.cloud import aiplatform
from vertexai.generative_models import GenerativeModel, Part, SafetySetting
import vertexai
import base64

次の環境変数を初期化します。

PROJECT_ID="ph-fm-svc-projects" # Google Cloud Project ID
LOCATION_ID="us-central1" # Enter Vertex AI Gemini region such a s us-central1
API_ENDPOINT="us-central1-aiplatform-restricted.p.googleapis.com" # PSC Endpoint
MODEL_ID="gemini-2.0-flash-001" # Gemini Model ID

Vertex AI SDK for Python を初期化します。

vertexai.init(project=PROJECT_ID,api_endpoint=API_ENDPOINT, api_transport="rest")

Vertex AI Gemini API に次のリクエストを行います。

import base64
from vertexai.generative_models import GenerativeModel, Part, SafetySetting

def generate(model_id, prompt):
    model = GenerativeModel(
        model_id,
    )
    responses = model.generate_content(
        [prompt],
        generation_config=generation_config,
        safety_settings=safety_settings,
        stream=True,
    )

    for response in responses:
        print(response.text, end="")

generation_config = {
    "max_output_tokens": 8192,
    "temperature": 1,
    "top_p": 0.95,
}

safety_settings = [
    SafetySetting(
        category=SafetySetting.HarmCategory.HARM_CATEGORY_HATE_SPEECH,
        threshold=SafetySetting.HarmBlockThreshold.OFF
    ),
    SafetySetting(
        category=SafetySetting.HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT,
        threshold=SafetySetting.HarmBlockThreshold.OFF
    ),
    SafetySetting(
        category=SafetySetting.HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT,
        threshold=SafetySetting.HarmBlockThreshold.OFF
    ),
    SafetySetting(
        category=SafetySetting.HarmCategory.HARM_CATEGORY_HARASSMENT,
        threshold=SafetySetting.HarmBlockThreshold.OFF
    ),
]

prompt = "which weighs more: 1kg feathers or 1kg stones"
generate(MODEL_ID,prompt)

この時点で、Jupyter ノートブックから Gemini に API 呼び出しを行い、 Google Cloudでホストされている Gemini にアクセスできます。呼び出しが成功すると、次のような出力が表示されます。

They weigh the same. Both weigh 1 kilogram.

Vertex AI REST API の使用手順

このセクションでは、プロセス全体で使用される重要な変数を設定します。これらの変数には、リソースのロケーション、特定の Gemini モデル、使用する Private Service Connect エンドポイントなど、プロジェクトに関する情報が格納されます。

Jupyter ノートブック内でターミナルウィンドウを開きます。