English
Deutsch
Español
Español – América Latina
Français
Indonesia
Italiano
Português – Brasil
中文 – 简体
中文 – 繁體
日本語
한국어

コンソール

お問い合わせ無料で利用開始

PyTorch - TPU のトラブルシューティング

このガイドでは、Cloud TPU で PyTorch モデルをトレーニングする際に発生する可能性のある問題の特定と解決に役立つトラブルシューティング情報について説明します。Cloud TPU を使い始める際の一般的なガイドについては、PyTorch クイックスタートをご覧ください。

トレーニングパフォーマンスが遅い場合のトラブルシューティング

モデルのトレーニングが遅い場合は、指標レポートを生成して確認します。

指標レポートを自動的に分析してサマリーを生成するには、PT_XLA_DEBUG=1 でワークロードを実行します。

モデルのトレーニングが遅くなる原因となる可能性のある問題については、既知のパフォーマンスに関する注意事項をご覧ください。

パフォーマンスプロファイリング

ワークロードを詳細にプロファイリングしてボトルネックを検出するには、次のリソースをご覧ください。

その他のデバッグツール

環境変数を指定して、PyTorch/XLA ソフトウェアスタックの動作を制御できます。

予期しないバグが発生してサポートが必要な場合は、GitHub で問題を報告してください。

XLA テンソルの管理

XLA テンソルの特徴では、XLA テンソルと共有重みを使用する場合に行うべきことと、すべきでないことについて説明しています。

特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。

最終更新日 2025-09-13 UTC。