On-Prem API 構成パラメータ

Speech-to-Text On-Prem ソリューションでは、一部の構成パラメータが公開されています。以下のパラメータは、CLI と Marketplace アプリのランチャー インストールの両方で公開されています。

パラメータ名 説明
名前 アプリケーションの名前。文字列「speech」は、安全なデフォルト値です。この値は $NAME として参照されます。
名前空間 アプリケーションがデプロイされる名前空間。文字列「speech」は、安全なデフォルト値です。この値は、$NAMESPACE として参照されます。
レプリカ ソリューションを実行するレプリカの数(デフォルトは 3)。これにより、アプリケーションを水平スケーリングできます。この値は、$REPLICAS として参照されます。
Pod あたりの CPU 数 Speech-to-Text バイナリを実行する各 Pod に割り当てる CPU の数。デフォルトは 2 ですが、2 以上にすることをおすすめします。この値は、$CPU として参照されます。クラスタで使用できる CPU の数を超えると、アプリは「Does not have minimum availability」または「Pod errors: Unschedulable」などのエラーをスローします。
Pod あたりのメモリ Speech-to-Text バイナリを実行する各 Pod に割り当てる RAM の量。デフォルトは 1Gi ですが、1Gi 以上にすることをおすすめします。この値は、$MEMORY として参照されます。クラスタで使用可能なメモリを超える数を指定すると、アプリは「Not does not availability」や「Pod errors: Unschedulable」などのエラーをスローします。
指標のエクスポート先の Google Cloud Platform プロジェクト ID (省略可)Google Cloud Platform プロジェクト ID を指定すると、オンプレミス サーバーはその Google Cloud Platform プロジェクトの Stackdriver に指標をエクスポートできます。On-Prem サーバーを実行する Google Cloud Platform プロジェクトを使用します。別のプロジェクトを指定する場合は、On-Prem サーバーを実行しているサービス アカウントに、そのプロジェクトに指標を送信する権限があることを確認してください。このフィールドが空の場合、指標は送信されません。この値は $METRIC_PROJECT として参照されます。
負荷分散のために Istio オブジェクトをインストール (省略可)gRPC ロード バランシング用に Istio オブジェクトをインストールするかどうかを指定できます。オンにすると、gRPC の受信リクエストがさまざまな Pod に分散されます。クラスタに Istio がインストールされている必要があります。インストールされていない場合は失敗します。この値は $ENABLE_ISTIO として参照されます。Istio のインストールと設定の詳細については、クイックスタート: 始める前にをご覧ください。
パブリック IP (省略可)このフィールドにパブリック IP アドレスを指定すると、ソリューションが一般公開されます。これは、クラスタがパブリック IP をサポートしていて、クラスタを実行しているリージョンにパブリック IP を割り当てている場合にのみ使用できます。パブリック IP を指定しない場合は、ネットワークを自分で構成する必要があります。この値は $PUBLIC_IP として参照されます。このパブリック IP はインターネットでアクセスできます。
モデル 1 受信した ASR リクエストを処理するには、オンプレミス サーバーの最初の言語を指定する必要があります。この値は $MODEL1 として参照されます。
モデル 2 受信した ASR リクエストを処理するには、オンプレミス サーバーの 2 つ目の言語を指定する必要があります。2 つ目の言語が不要な場合は、None を選択します。この値は、$MODEL2 として参照されます。
モデル 3 受信した ASR リクエストを処理するには、オンプレミス サーバーの 3 つ目の言語を指定する必要があります。3 つ目の言語が必要ない場合は、None を選択します。この値は、$MODEL3 として参照されます。
シークレット名 (GKE の場合は省略可。GKE On-Prem とその他のハイブリッド クラウドでは必須)GKE On-Prem クラスタ内の K8s Pod が Google Cloud サービスにクエリを実行するには、Google Cloud Platform プロジェクトの許可リストにある Google サービス アカウントが必要です。このサービス アカウントには、少なくともプロジェクト閲覧者の権限が必要です。Google サービス アカウントのキーをダウンロードして、アプリケーションと同じ名前空間の Secret にラップします。ファイルの名前は key.json にする必要があります。この値は $GSA_SECRET として参照されます。詳細については、Kubernetes のドキュメントをご覧ください。