Pod での分散処理
大規模言語モデル
-
Pax を使用して単一デバイスの TPU でトレーニングする
単一デバイス Cloud TPU で Pax を使用して SPMD モデルをトレーニングするためのガイド。
-
v5e での JetStream MaxText 推論
推論用に MaxText で JetStream を設定して使用するガイド。
-
v5e での JetStream PyTorch 推論
推論用に PyTorch で JetStream を設定して使用するガイド。
-
GKE で TPU と vLLM を使用して LLM を提供する
vLLM を使用して Google Kubernetes Engine(GKE)で Tensor Processing Unit(TPU)を使用して大規模言語モデル(LLM)を提供するガイド。