English
Deutsch
Español – América Latina
Français
Português – Brasil
中文 – 简体
日本語
한국어

Console

Kontakt Jetzt kostenlos testen

Anleitungen

Large Language Models

JetStream-MaxText-Inferenz auf v6e

Anleitung zum Einrichten und Verwenden von JetStream mit MaxText für die Inferenz auf v6e.
JetStream-PyTorch-Inferenz auf v6e

Eine Anleitung zum Einrichten und Verwenden von JetStream mit PyTorch für die Inferenz auf v6e.
vLLM-Inferenz auf v6e

Anleitung zum Einrichten und Verwenden von vLLM für die Inferenz auf v6e.
LLM mithilfe von TPUs in GKE mit vLLM bereitstellen

Ein Leitfaden zur Verwendung von vLLM zum Bereitstellen von Large Language Models (LLMs) mit Tensor Processing Units (TPUs) in Google Kubernetes Engine (GKE).

Diffusionsmodelle

MaxDiffusion-Inferenz auf v6e

Anleitung zum Einrichten und Verwenden von MaxDiffusion für die Inferenz auf v6e.

Bildklassifizierung

ResNet auf Cloud TPU trainieren (PyTorch)

ResNet-Bildklassifizierungsmodell mit PyTorch, optimiert für die Ausführung auf Cloud TPU.

Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.