クイックスタート: Custom Vision ポータルを使用して画像分類モデルを構築する

2025-03-26

このクイックスタートでは、Custom Vision Web ポータルを使用して画像分類モデルを作成する方法について説明します。モデルを作成したら、新しい画像でテストを行い、最終的に、独自の画像認識アプリに統合することができます。

前提条件

Azure サブスクリプション。無料アカウントを作成することができます。
分類モデルをトレーニングするための画像のセット。 GitHub 上のサンプルイメージのセットを使用することができます。または、以下のヒントを使用して、独自の画像を選択することもできます。
サポートされる Web ブラウザー。

Custom Vision リソースを作成する

Custom Vision サービスを使用するには、Azure で Custom Vision のトレーニングリソースと予測リソースを作成する必要があります。 Azure portal で、[Custom Vision の作成] ページを使用して、トレーニングリソースと予測リソースの両方を作成します。

新しいプロジェクトの作成

Custom Vision Web ページに移動し、Azure portal へのサインインに使用したのと同じアカウントでサインインします。

Custom Vision サインインページを示すスクリーンショット。

最初のプロジェクトを作成するには、 [新しいプロジェクト] を選択します。 [新しいプロジェクトの作成] ダイアログボックスが表示されます。
プロジェクトの名前と説明を入力します。次に、Custom Vision トレーニングリソースを選択します。サインインしたアカウントが Azure アカウントに関連付けられている場合は、[リソース] ドロップダウンに、互換性のあるすべての Azure リソースが表示されます。

注

使用可能なリソースがない場合は、Azure portal へのサインインに使用したのと同じアカウントで customvision.ai にサインインしていることを確認します。また、Custom Vision Web サイトで、 Custom Vision リソースが配置されている Azure portal のディレクトリと同じディレクトリを選択していることを確認します。どちらのサイトでも、画面の右上隅にあるドロップダウンアカウントメニューから、ディレクトリを選択できます。
プロジェクトの種類 で分類を選択します。次に、分類の種類 で、実際のユースケースに応じて マルチラベル または マルチクラス のいずれかを選択します。マルチラベル分類では、ある画像 (0 個以上) に任意の数のタグを適用します。一方、マルチクラス分類では、画像は 1 つのカテゴリへと分類されます (送信するすべての画像が、最も可能性の高いタグに分類されます)。希望する場合は、後で分類の種類を変更できます。

次に、使用可能なドメインのいずれかを選択します。各ドメインでは、次の表で説明するように、特定の種類の画像用にモデルが最適化されます。必要に応じて後からドメインを変更できます。

ドメイン	目的
全般	さまざまな画像分類タスクに最適化されています。他のドメインのいずれも適切でないか、どのドメインを選択すればよいか不確かな場合は、汎用ドメインを選択してください。
食料	レストランのメニューで見るような料理の写真に最適化されています。個々のフルーツや野菜の写真を分類する場合、食料ドメインを使用します。
ランドマーク	自然物と人工物の両方の認識可能なランドマークに最適化されています。このドメインは、ランドマークが写真にはっきりと映っているときに最も効果があります。このドメインは、ランドマークがその前にいる人々によって少し邪魔されている場合でも機能します。
小売	ショッピングカタログやショッピング Web サイトで見られる画像に最適化されています。ドレス、ズボン、シャツを分類するときに高い精度が必要な場合に、このドメインを使用します。
コンパクトドメイン	モバイルデバイスでのリアルタイムの分類の制約に最適化されています。コンパクトドメインで生成されたモデルは、ローカルで実行するためにエクスポートできます。

最後に、[プロジェクトの作成] を選択します。

トレーニング画像を選択する

最低要件として、初期トレーニングセットでは、タグごとに少なくとも 30 枚の画像を使用する必要があります。トレーニング後にモデルをテストするために、いくつかの追加の画像も収集する必要があります。

モデルを効果的にトレーニングするには、視覚的に多様性のある画像を使用します。以下の点で変化に富んだ画像を選択してください。

カメラのアングル
照明
バックグラウンド
見た目のスタイル
個人またはグループになっている被写体
サイズ
type

さらに、すべてのトレーニング画像が以下の条件を満たしていることを確認します。

.jpg、.png、.bmp、.gif のいずれかの形式であること
サイズが 6 MB (予測画像の場合は 4 MB) 以下であること
短辺が 256 ピクセル以上であること。256 ピクセルより短い画像はすべて Custom Vision サービスによって自動的にスケールアップされます

画像をアップロードし、タグ付けする

分類子のトレーニングに役立つように、画像をアップロードして手動でタグ付けできます。

画像を追加するには、 [画像の追加] を選択し、 [ローカルファイルの参照] を選択します。 [開く] を選択し、タグ付けに移動します。タグの選択は、アップロードする画像のグループ全体に適用されます。そのため、適用されたタグに従って別個のグループで画像をアップロードする方が簡単です。また、アップロード後に個々の画像のタグを変更することもできます。
タグを作成するには、マイタグ フィールドにテキストを入力し、Enter キーを押します。タグが既に存在する場合は、ドロップダウンメニューに表示されます。マルチラベルプロジェクトでは画像に複数のタグを追加できますが、マルチクラスプロジェクトで追加できるのは 1 つだけです。画像のアップロードを終えるには、 [数字] 個のファイルのアップロード ボタンを使用します。
画像がアップロードされたら、[完了] を選択します。

別の画像のセットをアップロードするには、このセクションの先頭に戻り、手順を繰り返します。

分類子をトレーニングする

分類子をトレーニングするには、 [トレーニング] ボタンを選択します。分類子は、現在の画像をすべて使用し、各タグの視覚的特性を識別するモデルを作成します。この処理は数分かかる場合があります。

Web ページのヘッダーツールバーの右上にあるトレーニングボタンのスクリーンショット。

トレーニングプロセスの所要時間は、わずか数分間のはずです。この時間の間、[パフォーマンス] タブにトレーニングプロセスに関する情報が表示されます。

メインセクションにトレーニングの詳細が表示されたブラウザーウィンドウのスクリーンショット。

分類子を評価する

トレーニングが完了すると、モデルのパフォーマンスが推定され、表示されます。 Custom Vision Service は、トレーニング用に送信された画像を使用して精度と再現率を計算します。精度と再現率は、分類子の有効性を表す 2 つの異なる測定値です。

精度は、正しかったと識別された分類の割合を示します。たとえばあるモデルで、100 個の画像が犬として識別され、それらのうち 99 個が実際に犬であった場合、精度は 99% になります。
再現率は、正しく識別された実際の分類の割合を示します。たとえば、実際にりんごである画像が 100 個あり、そのモデルで、80 個がりんごとして識別された場合、再現率は 80% になります。

トレーニング結果のスクリーンショット。全体的な精度および再現率と、分類子のタグごとの精度および再現率が表示されています。

確率しきい値

[パフォーマンス] タブの左ウィンドウにある 確率しきい値 スライダーに注目してください。これは、正しいと見なされるために予測で必要となる信頼度です (精度と再現率を計算するため)。

高い確率しきい値を指定した予測呼び出しを解釈する場合、再現率を犠牲にして高い精度で結果が返される傾向があります。検出される分類は正しいですが、多くは検出されないままです。低い確率しきい値はその逆を行います。実際の分類のほとんどが検出されますが、そのセット内には誤検知が多くあります。これを念頭に置いて、プロジェクトの具体的な必要に応じて確率しきい値を設定する必要があります。その後、クライアント側で予測結果を受け取る場合は、ここで使用したのと同じ確率しきい値の値を使用する必要があります。

トレーニングのイテレーションを管理する

分類器をトレーニングするたびに、更新したパフォーマンスメトリックを使用して新しいイテレーションを作成します。 [パフォーマンス] タブの左側ウィンドウで、すべてのイテレーションを参照できます。また、 [削除] ボタンが表示されます。古くなっている場合は、このボタンを使用してイテレーションを削除できます。イテレーションを削除すると、それに一意に関連付けられていた画像がすべて削除されます。

トレーニング済みのモデルにプログラムでアクセスする方法については、「Prediction API の呼び出し」を参照してください。

次のステップ

このクイックスタートでは、Custom Vision Web ポータルを使用して、画像分類モデルを作成し、トレーニングする方法について説明しました。次に、モデルを改善するための反復的プロセスについて、より多くの情報を入手してください。

モデルのテストと再トレーニング

Custom Vision とは