In dieser Anleitung erfahren Sie, wie Sie einen Remote-Server für das Model Context Protocol (MCP) in Cloud Run mit dem streamable HTTP transport erstellen und bereitstellen. Beim streamfähigen HTTP-Transport läuft der MCP-Server als unabhängiger Prozess, der mehrere Clientverbindungen verarbeiten kann.
Ziele
In dieser Anleitung wird Folgendes beschrieben:
Kosten
In diesem Dokument verwenden Sie die folgenden kostenpflichtigen Komponenten von Google Cloud:
Mit dem Preisrechner können Sie eine Kostenschätzung für Ihre voraussichtliche Nutzung vornehmen.
Hinweise
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Artifact Registry, Cloud Run Admin API, and Cloud Build APIs.
- Richten Sie Ihre Cloud Run-Entwicklungsumgebung in Ihrem Google Cloud -Projekt ein.
- Achten Sie darauf, dass Sie die entsprechenden Berechtigungen zum Bereitstellen von Diensten haben und Ihrem Konto die Rollen Cloud Run-Administrator (
roles/run.admin
) und Dienstkontonutzer (roles/iam.serviceAccountUser
) zugewiesen sind. - Weisen Sie Ihrem Konto die Rolle Cloud Run Invoker (
roles/run.invoker
) zu. Mit dieser Rolle kann der Remote-MCP-Server auf den Cloud Run-Dienst zugreifen. -
Rufen Sie in der Google Cloud Console die Seite IAM auf.
IAM aufrufen - Wählen Sie das Projekt aus.
- Klicken Sie auf Zugriffsrechte erteilen.
-
Geben Sie im Feld Neue Hauptkonten Ihre Nutzer-ID ein. Dies ist in der Regel die E‑Mail-Adresse des Google-Kontos, das zum Bereitstellen des Cloud Run-Dienstes verwendet wurde.
- Wählen Sie in der Liste Rolle auswählen eine Rolle aus.
- Wenn Sie weitere Rollen zuweisen möchten, klicken Sie auf Weitere Rolle hinzufügen und fügen Sie weitere Rollen hinzu.
- Klicken Sie auf Speichern.
- PROJECT_NUMBER: Ihre Google Cloud -Projektnummer.
- PROJECT_ID: Ihre Google Cloud -Projekt-ID
- PRINCIPAL: Die E-Mail-Adresse des Kontos, dem Sie die Rolle zuweisen.
- ROLE: Die Rolle, die Sie dem Bereitstellungskonto hinzufügen.
Wenn Sie einer Domaineinschränkung zur Organisation nicht eingeschränkter Aufrufe für Ihr Projekt unterliegen, müssen Sie auf Ihren bereitgestellten Dienst zugreifen, wie unter Private Dienste testen beschrieben.
- Installieren Sie Uv, einen Python-Paket- und Projektmanager.
Rollen zuweisen
Konsole
gcloud
So weisen Sie Ihrem Konto die erforderlichen IAM-Rollen für Ihr Projekt zu:
gcloud projects add-iam-policy-binding PROJECT_ID \ --member=PRINCIPAL \ --role=ROLE
Ersetzen Sie:
Python-Projekt vorbereiten
In den folgenden Schritten wird beschrieben, wie Sie Ihr Python-Projekt mit dem Paketmanager uv
einrichten.
Erstellen Sie einen Ordner mit dem Namen
mcp-on-cloudrun
, um den Quellcode für die Bereitstellung zu speichern:mkdir mcp-on-cloudrun cd mcp-on-cloudrun
Erstellen Sie mit dem Tool
uv
ein Python-Projekt, um einepyproject.toml
-Datei zu generieren:uv init --name "mcp-on-cloudrun" --description "Example of deploying an MCP server on Cloud Run" --bare --python 3.10
Mit dem Befehl
uv init
wird die folgende Dateipyproject.toml
erstellt:[project] name = "mcp-server" version = "0.1.0" description = "Example of deploying an MCP server on Cloud Run" readme = "README.md" requires-python = ">=3.10" dependencies = []
Erstellen Sie die folgenden zusätzlichen neuen Dateien:
server.py
für den MCP-Server-Quellcodetest_server.py
, um den Remote-Server zu testen- Dockerfile für die Bereitstellung in Cloud Run
touch server.py test_server.py Dockerfile
Ihr Projektverzeichnis sollte die folgende Struktur haben:
├── mcp-on-cloudrun │ ├── pyproject.toml │ ├── server.py │ ├── test_server.py │ └── Dockerfile
MCP-Server für mathematische Operationen erstellen
Um wertvollen Kontext für die Verbesserung der Verwendung von LLMs mit MCP bereitzustellen, richten Sie einen mathematischen MCP-Server mit FastMCP ein. FastMCP bietet eine schnelle Möglichkeit, MCP-Server und ‑Clients mit Python zu erstellen.
So erstellen Sie einen MCP-Server für mathematische Operationen wie Addition und Subtraktion:
Führen Sie den folgenden Befehl aus, um FastMCP als Abhängigkeit in der Datei
pyproject.toml
hinzuzufügen:uv add fastmcp==2.8.0 --no-sync
Fügen Sie der Datei
server.py
den folgenden Quellcode für den Math-MCP-Server hinzu:Fügen Sie der Dockerfile den folgenden Code hinzu, um das Tool
uv
zum Ausführen der Dateiserver.py
zu verwenden:
In Cloud Run bereitstellen
Sie können den MCP-Server als Container-Image oder als Quellcode bereitstellen:
Container-Image
Folgen Sie dieser Anleitung, um einen MCP-Server bereitzustellen, der als Container-Image verpackt ist.
Erstellen Sie ein Artifact Registry-Repository zum Speichern des Container-Images:
gcloud artifacts repositories create remote-mcp-servers \ --repository-format=docker \ --location=us-central1 \ --description="Repository for remote MCP servers" \ --project=PROJECT_ID
Erstellen Sie das Container-Image und übertragen Sie es per Push mit Cloud Build in Artifact Registry:
gcloud builds submit --region=us-central1 --tag us-central1-docker.pkg.dev/PROJECT_ID/remote-mcp-servers/mcp-server:latest
Stellen Sie das Container-Image des MCP-Servers in Cloud Run bereit:
gcloud run deploy mcp-server \ --image us-central1-docker.pkg.dev/PROJECT_ID/remote-mcp-servers/mcp-server:latest \ --region=us-central1 \ --no-allow-unauthenticated
Quelle
Sie können Remote-MCP-Server aus ihren Quellen in Cloud Run bereitstellen.
Stellen Sie es mit dem folgenden Befehl aus der Quelle bereit:
gcloud run deploy mcp-server --no-allow-unauthenticated --region=us-central1 --source .
MCP-Client authentifizieren
Wenn Sie Ihren Dienst mit dem Flag --no-allow-unauthenticated
bereitgestellt haben, muss sich jeder MCP-Client, der eine Verbindung zu Ihrem Remote-MCP-Server herstellt, authentifizieren.
Weisen Sie dem Dienstkonto die Rolle Cloud Run Invoker (
roles/run.invoker
) zu. Diese IAM-Richtlinienbindung sorgt dafür, dass ein starker Sicherheitsmechanismus zur Authentifizierung Ihres lokalen MCP-Clients verwendet wird.Führen Sie den Cloud Run-Proxy aus, um einen authentifizierten Tunnel zum Remote-MCP-Server auf Ihrem lokalen Computer zu erstellen:
gcloud run services proxy mcp-server --region=us-central1
Wenn der Cloud Run-Proxy noch nicht installiert ist, werden Sie mit diesem Befehl aufgefordert, ihn herunterzuladen. Folgen Sie der Anleitung, um den Proxy herunterzuladen und zu installieren.
Cloud Run authentifiziert den gesamten Traffic zu http://127.0.0.1:8080
und leitet Anfragen an den Remote-MCP-Server weiter.
Remote-MCP-Server testen
Sie testen und stellen eine Verbindung zum Remote-MCP-Server her, indem Sie auf die URL http://127.0.0.1:8080/mcp
zugreifen.
So testen und rufen Sie den Mechanismus zum Addieren und Subtrahieren auf:
Bevor Sie den Testserver ausführen, führen Sie den Cloud Run-Proxy aus.
Erstellen Sie eine Testdatei mit dem Namen
test_server.py
und fügen Sie den folgenden Code ein:Führen Sie in einem neuen Terminal den Testserver aus:
uv run test_server.py
Es sollte folgende Ausgabe angezeigt werden:
🛠️ Tool found: add 🛠️ Tool found: subtract 🪛 Calling add tool for 1 + 2 ✅ Result: 3 🪛 Calling subtract tool for 10 - 3 ✅ Result: 7
Bereinigen
Damit Ihrem Google Cloud -Konto keine zusätzlichen Kosten in Rechnung gestellt werden, löschen Sie alle Ressourcen, die Sie mit dieser Anleitung bereitgestellt haben.
Projekt löschen
Wenn Sie ein neues Projekt für diese Anleitung erstellt haben, löschen Sie das Projekt. Wenn Sie ein vorhandenes Projekt verwendet haben und es beibehalten möchten, ohne die Änderungen in dieser Anleitung hinzuzufügen, löschen Sie die für die Anleitung erstellten Ressourcen.
Am einfachsten vermeiden Sie weitere Kosten, wenn Sie das zum Ausführen der Anleitung erstellte Projekt löschen.
So löschen Sie das Projekt:
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Anleitungsressourcen löschen
Löschen Sie den Cloud Run-Dienst, den Sie in dieser Anleitung bereitgestellt haben. Für Cloud Run-Dienste fallen erst Kosten an, wenn sie Anfragen empfangen.
Führen Sie den folgenden Befehl aus, um Ihren Cloud Run-Dienst zu löschen:
gcloud run services delete SERVICE-NAME
Ersetzen Sie SERVICE-NAME durch den Namen Ihres Dienstes.
Sie können Cloud Run-Dienste auch über die Google Cloud Console löschen.
Entfernen Sie die Konfiguration der Standardregion
gcloud
, die Sie während der Einrichtung für die Anleitung hinzugefügt haben:gcloud config unset run/region
Entfernen Sie die Projektkonfiguration:
gcloud config unset project