Databricks での AI および機械学習の概要

データ準備から運用監視までの AI ライフサイクル全体を統合した統合プラットフォームである Mosaic AI を使用して、AI と機械学習アプリケーションを構築、デプロイ、管理します。

作業を開始するための一連のチュートリアルについては、 AI と機械学習のチュートリアルを参照してください。

生成型 AI アプリケーションを構築する

微調整された LLM、AI エージェント、検索拡張生成などのエンタープライズグレードの生成 AI アプリケーションを開発してデプロイします。

Feature	Description
AI プレイグラウンド	コードなしのプロンプトエンジニアリングとパラメーターチューニングを使用して、生成 AI モデルのプロトタイプとテストを行います。
エージェントブリックス	一般的な AI ユースケースに合わせて、ドメイン固有の高品質の AI エージェントシステムを構築および最適化するための簡単なアプローチ。
基盤モデル	セキュリティで保護されたスケーラブルな API を使用して、Meta Llama、Anthropic Claude、OpenAI GPT などの最先端の LLM を提供します。
モザイク人工知能エージェントフレームワーク	PYTHON を使用して、RAG アプリケーションやマルチエージェントシステムを含む運用品質のエージェントを構築してデプロイします。
GenAI の MLflow	AI を利用したメトリックと包括的なトレース監視機能を使用して、GenAI アプリケーションライフサイクル全体の品質を測定、改善、監視します。
ベクトル検索	RAG アプリケーションのナレッジベースと自動同期を使用して、埋め込みベクターを格納およびクエリします。
サーバーレス GPU コンピューティング	お気に入りのフレームワークを使用してカスタムモデルをトレーニングおよび微調整するために、単一ノードとマルチノードのディープラーニングワークロードをカスタマイズし、最先端の効率、パフォーマンス、品質を実現します。
基盤モデルの微調整	独自のデータを使用して基礎モデルをカスタマイズし、特定のアプリケーションのパフォーマンスを最適化します。

従来の機械学習モデルをトレーニングする

自動化されたツールとコラボレーション開発環境を使用して機械学習モデルを作成します。

Feature	Description
AutoML	機能エンジニアリングとハイパーパラメーターの自動チューニングを使用して、最小限のコードで高品質のモデルを自動的に構築します。
Databricks Runtime for ML	TensorFlow、PyTorch、Keras、GPU がディープラーニング開発用にサポートされている事前構成済みのクラスター。
MLflow の追跡	実験を追跡し、モデルのパフォーマンスを比較し、完全なモデル開発ライフサイクルを管理します。
特徴エンジニアリング	自動化されたデータパイプラインと機能検出を使用して、機能を作成、管理、提供します。
Databricks ノートブック	ML ワークフロー用の Python、R、Scala、SQL をサポートするコラボレーション開発環境。

ディープラーニングモデルをトレーニングする

組み込みのフレームワークを使用してディープラーニングモデルを開発します。

Feature	Description
分散トレーニング	Ray、TorchDistributor、DeepSpeed を使用した分散ディープラーニングの例。
Databricks でのディープラーニングのベストプラクティス	Databricks でのディープラーニングのベストプラクティス。
PyTorch	PyTorch を使用した単一ノードおよび分散トレーニング。
TensorFlow	TensorFlow と TensorBoard を使用した単一ノードおよび分散トレーニング。
参照ソリューション	ディープラーニングのリファレンスソリューション。

モデルのデプロイと運用

スケーラブルなエンドポイント、リアルタイム推論、エンタープライズレベルの監視を使用して、モデルを運用環境にデプロイします。

Feature	Description
モデルサービング	自動スケーリングと GPU サポートを使用して、カスタムモデルと LLM をスケーラブルな REST エンドポイントとしてデプロイします。
AI ゲートウェイ	使用状況の追跡、ペイロードのログ記録、セキュリティ制御を使用して、生成型 AI モデルへのアクセスを管理および監視します。
外部モデル	Databricks の外部でホストされているサードパーティ製モデルを、統合されたガバナンスと監視と統合します。
Foundation Model API	Databricks によってホストされている最新のオープンモデルにアクセスしてクエリを実行します。

ML システムの監視と管理

包括的な監視およびガバナンスツールを使用して、モデルの品質、データの整合性、コンプライアンスを確保します。

Feature	Description
Unity カタログ	統合されたアクセス制御、系列の追跡、検出を使用して、データ、機能、モデル、および機能を管理します。
データプロファイリング	自動化されたアラートと根本原因分析を使用して、データ品質、モデルのパフォーマンス、予測の誤差を監視します。
異常検出	カタログレベルでデータの鮮度と完全性を監視します。
モデル用 MLflow	開発ライフサイクル全体を通じて、生成型 AI アプリケーションを追跡、評価、監視します。

ML ワークフローの運用化

自動化されたワークフロー、CI/CD 統合、運用対応パイプラインを使用して機械学習操作をスケーリングします。

Feature	Description
Unity Catalog のモデル	Unity カタログのモデルレジストリを使用して、一元的なガバナンスを行い、デプロイを含むモデルのライフサイクルを管理します。
Lakeflow ジョブ	ML データ処理用の自動化されたワークフローと運用対応の ETL パイプラインを構築します。
Ray on Databricks	大規模なモデルのトレーニングと推論のために分散コンピューティングを使用して ML ワークロードをスケーリングします。
MLOps ワークフロー	トレーニング、テスト、デプロイの自動化されたパイプラインを使用して、エンドツーエンドの MLOps を実装します。
Git 統合	シームレスな Git 統合とコラボレーション開発を使用して、ML コードとノートブックをバージョン管理します。

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-10-09