このページでは、Cloud Run サービス向け構成オプションの概要について説明します。
コールド スタートを回避してレイテンシを短縮する
インスタンスの最小数を設定することで、アプリケーションのコールド スタートを回避して、アプリケーションのレイテンシを短縮できます。インスタンスの最小数を設定すると費用が発生します。詳細については、サービスの最小インスタンス数を設定するをご覧ください。
キャパシティ
サービスが使用できるメモリ量、CPU 量、最大同時実行数を設定できます。
課金設定で課金の方式を指定できます。インスタンスがリクエストを処理したときだけ課金される「リクエスト単位」の方式か、インスタンスのライフサイクル全体に対して課金される方式のいずれかを選べます。
環境変数
Cloud Run サービスで使用する Key-Value ペアを作成できます。詳細については、サービスの環境変数を構成するをご覧ください。
実行環境
Cloud Run には 2 つの実行環境があります。両方の実行環境の違いもご確認ください。
GPU
推論モデルやモデル トレーニングなどの AI ワークロードをホストする必要がある場合は、GPU の有無にかかわらず Cloud Run サービスを構成できます。
高いリクエスト レベルから保護する
最大インスタンス数と最小インスタンス数を設定することで、Cloud Run サービスがリクエストを処理するために作成するインスタンスの数を調整できます。そうすることで、コストを抑えたり、異常に高いリクエスト レベルを防いだりといった対応が可能になります。
ヘルスチェック
Cloud Run では、2 種類のヘルスチェック プローブを構成できます。1 つのプローブは、コンテナがトラフィックを受け入れる準備ができているかどうかを判断し、もう 1 つのプローブはコンテナを再起動するかどうかを判断します。詳しくは、コンテナのヘルスチェックをご覧ください。
ラベル
Cloud Run ラベルは、Cloud Run のサービス、リビジョン、Cloud Run functions の関数に適用できる Key-Value ペアです。ラベルを使うことで、Cloud Run のリソースを整理しやすくなり、大規模な運用でも必要な粒度でコストを管理できるようになります。
gcloud functions
コマンドまたは Cloud Functions v2 API を使って Cloud Run functions の関数に設定したラベルは、関数を Cloud Run にデプロイするときに Cloud Run に伝播されます。
スケーリング
デフォルトでは、Cloud Run はトラフィックや CPU 使用率に応じて、指定されたインスタンス数、またはデフォルトの最大インスタンス数まで自動的にスケールアウトします。ただし、ユースケースによっては、手動スケーリングを使ってインスタンス数を固定したい場合もあると想定されます。
Secret
Cloud Run で Secret Manager を使うことで、API キーやパスワードなどの機密情報を安全に保存できます。詳細については、シークレットを構成するをご覧ください。
サービス ID
Cloud Run サービス ID は、Cloud Run インスタンス コンテナからGoogle Cloud API にアクセスするための認証済みアカウントとして使用されるサービス アカウントです。サービス アカウントを作成し、特定の Google Cloudリソースにアクセスするためにサービス アカウントが必要とする最小限の権限を付与することをおすすめします。
タイムアウト
Cloud Run のリクエスト タイムアウトを設定して、一定時間以内にレスポンスを返すように指定できます。
推奨事項
Cloud Run における Recommender による最適化の内容については、Recommender による最適化をご覧ください。
トラフィック分割
サービスをデプロイまたは再デプロイすると、基盤となる Cloud Run サービスの新しいリビジョンが自動的に作成されます。詳細については、セッション アフィニティとトラフィック分割をご覧ください。
タグサービス
タグは Key-Value ペアであり、Cloud Run コンソールを使ってリソースに適用することで、きめ細かいアクセス制御を行えるようにするものです。
タグ管理者は、組織またはプロジェクト レベルで Google Cloud のリソースにタグを作成します。タグを使用すると、リソースに特定のタグが付加されているかどうかに基づいて、条件付きでポリシーを許可または拒否することができます。詳細については、サービスへのタグ付けについての説明をご覧ください。
ボリューム マウント
Cloud Run のボリューム マウントを使用すると、ローカル ファイル システムに保存されている共有データ(ストレージ バケットやファイル サーバーのコンテンツなど)にコンテナからアクセスできます。Cloud Storage バケット、NFS 共有(Filestore インスタンスなど)、Cloud Run が提供するインメモリ ファイル システム、NBD、9P、CIFS/Samba、Ceph のネットワーク ファイル システムをマウントできます。