Important
この機能は ベータ版です。
このページには、サーバーレス GPU コンピューティングで DeepSpeed を使用した分散トレーニングのノートブックの例が含まれています。
DeepSpeed と TRL を使用して教師ありの微調整
このノートブックでは、サーバーレス GPU Python API を使用して、DeepSpeed ZeRO Stage 3 最適化を使用して トランスフォーマー強化学習 (TRL) ライブラリ を使用して監視微調整 (SFT) を実行する方法を示します。