大規模言語モデル
-
v6e での JetStream MaxText 推論
v6e での推論用に MaxText で JetStream を設定して使用するガイド。
-
v6e での JetStream PyTorch 推論
v6e での推論用に PyTorch で JetStream を設定して使用するガイド。
-
v6e での vLLM 推論
v6e での推論用に vLLM を設定して使用するガイド。
-
GKE で TPU と vLLM を使用して LLM を提供する
vLLM を使用して Google Kubernetes Engine(GKE)で Tensor Processing Unit(TPU)を使用して大規模言語モデル(LLM)を提供するガイド。
-
TPU v5e で PyTorch を使用して Llama 3 をトレーニングする
WikiText データセットを使用して TPU v5e で PyTorch/XLA を使用して Llama-3-8B モデルをトレーニングするガイド。