完全シャード型データ並列 (FSDP) トレーニング

Important

この機能はベータ版です。

このページには、サーバーレス GPU コンピューティングで完全シャードデータ並列 (FSDP) トレーニングを使用するためのノートブックの例が含まれています。これらの例では、パフォーマンスを向上させるために、複数の GPU とノード間でトレーニングをスケーリングする方法を示します。

FSDP2 を使用した 1,000 万パラメーターのトランスフォーマーモデルのトレーニング

次のノートブックは、 FSDP2 ライブラリを使用した 1,000 万個のパラメータートランスフォーマーモデルの分散トレーニングを示しています。

Notebook

ノートブックを入手

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-09-30