次の方法で共有


Document Intelligence Studio カスタム プロジェクトを作成する

このコンテンツの適用対象:checkmarkv4.0 (GA) | 以前のバージョン:青のチェックマークv3.1 (GA)青のチェックマークv3.0 (GA)

Azure AI Document Intelligence Studio は、ドキュメント インテリジェンスの機能を視覚的に調査し、理解し、アプリケーションに統合するために使用できるオンライン ツールです。 このクイック スタートでは、Document Intelligence Studio でカスタム プロジェクトを設定する方法について説明します。

[前提条件]

サブスクリプション、リソース、認証のセットアップの詳細については、「 Document Intelligence Studio の概要」を参照してください。

新しいユーザー向けの前提条件

Azure アカウントとドキュメント インテリジェンスまたは Azure AI Foundry リソースに加えて、Azure Blob Storage コンテナーと Azure ロールの割り当てが必要です。

Azure BLOB Storage コンテナー

標準的なパフォーマンスの Azure Blob Storage アカウントが必要です。 ストレージ アカウント内にトレーニング ドキュメントを格納および整理するためのコンテナーを作成できます。 コンテナーを使用して Azure ストレージ アカウントを作成する方法がわからない場合は、次のクイックスタートに従います。

  • ストレージ アカウントを作成する: ストレージ アカウントを作成するときに、[インスタンスの 詳細>パフォーマンス ] フィールドで[Standard performance]\( 標準 パフォーマンス\) を選択します。
  • コンテナーを作成する: コンテナーを作成するときに、[ 新しいコンテナー ] ウィンドウで、[ パブリック アクセス レベル ] フィールドを [コンテナー ] (コンテナーと BLOB の匿名読み取りアクセス) に設定します。

Azure でのロールの割り当て

カスタム プロジェクトでは、さまざまなシナリオで次のロールの割り当てが必要です。

  • Basic

    • Cognitive Services ユーザー: カスタム モデルをトレーニングしたり、トレーニング済みのモデルを使用して分析を行ったりするには、ドキュメント インテリジェンスまたは Azure AI Foundry リソースにこのロールが必要です。
    • ストレージ BLOB データ共同作成者: プロジェクトとラベル データを作成するには、ストレージ アカウントにこのロールが必要です。
  • 詳細

    • ストレージ アカウント共同作成者: クロスオリジン リソース共有 (CORS) 設定を設定するには、ストレージ アカウントにこのロールが必要です。 (同じストレージ アカウントが再利用される場合、このアクションは 1 回限りの作業です)。
    • 共同作成者: リソース グループとリソースを作成するには、このロールが必要です。

    Note

    Document Intelligence サービス リソースとストレージ アカウントに対してローカル (キーベース) 認証が無効になっている場合は、Document Intelligence Studio を使用するための十分なアクセス許可が付与されるように、Cognitive Services ユーザーロールとストレージ BLOB データ共同作成者ロールをそれぞれ取得してください。 ストレージ アカウントの共同作成者ロールと共同作成者ロールを使用すると、キーを一覧表示できますが、キー アクセスが無効になっている場合にリソースを使用するアクセス許可は付与されません。

CORS の構成

Document Intelligence Studio からアクセスできるようにするには、クロスオリジン リソース共有を Azure ストレージ アカウントで構成する必要があります。 Azure portal で CORS を構成するには、ストレージ アカウントの [CORS] タブへのアクセスが必要になります。

  1. ストレージ アカウントの [CORS] タブを選択します。

    Azure portal の CORS 設定メニューを示すスクリーンショット。

  2. まず、[ BLOB サービス ] タブで新しい CORS エントリを作成します。

  3. 許可される配信元をhttps://documentintelligence.ai.azure.comに設定します。

    ストレージ アカウントの CORS 構成を示すスクリーンショット。

    指定したドメインの代わりにワイルドカード文字 * を使用して、すべての配信元ドメインが CORS 経由で要求を行えるようにすることができます。

  4. Allowed メソッドで使用可能なすべての 8 つのオプションを選択します。

  5. 各フィールドにアスタリスク (*) を入力して、 許可されているすべてのヘッダー公開ヘッダー を承認します。

  6. 最大有効期間を 120 秒または任意の許容値に設定します。

  7. 変更を保存するには、ページの上部にある [保存] を選択します。

これで、CORS は、Document Intelligence Studio からストレージ アカウントを使用するように構成されました。

サンプル ドキュメント セット

  1. Azure portal にサインインします。 ストレージ アカウントに移動し、 データ ストレージ>Containers を選択します。

    Azure portal の [データ ストレージ] メニューを示すスクリーンショット。

  2. 一覧からコンテナーを選択します。

  3. ページの上部にあるメニューで、[ アップロード] を選択します。

    Azure portal のコンテナーの [アップロード] ボタンを示すスクリーンショット。

  4. [ BLOB のアップロード ] ウィンドウで、アップロードするファイルを選択します。

    Azure portal の [BLOB のアップロード] ウィンドウを示すスクリーンショット。

Note

既定では、Document Intelligence Studio はコンテナーのルートにあるドキュメントを使用します。 カスタム フォーム プロジェクトを作成する手順でフォルダー パスを指定することで、フォルダーに整理されたデータを使用できます。 詳細については、「 サブフォルダーにデータを整理する」を参照してください。

Document Intelligence Studio 機能を使用する

事前構築済みモデルまたは独自のモデルのいずれかを使用してドキュメントに自動ラベル付けする

カスタム抽出モデルのラベル付けページで、ドキュメント インテリジェント サービスの事前構築済みモデルまたはトレーニング済みモデルのいずれかを使用して、ドキュメントに自動ラベル付けできるようになりました。

自動ラベル付けを示すアニメーション化されたスクリーンショット。

一部のドキュメントでは、自動ラベル付けを実行した後に重複ラベルが存在する場合があります。 後でラベル付けページに重複するラベルがないように、ラベルを変更してください。

自動ラベル付け後の重複ラベルの警告を示すスクリーンショット。

テーブルの自動ラベル付け

カスタム抽出モデルのラベル付けページで、手動でテーブルにラベルを付けなくても、ドキュメント内のテーブルに自動ラベル付けできるようになりました。

自動テーブル のラベル付けを示すアニメーション化されたスクリーンショット。

テスト ファイルをトレーニング データセットに直接追加する

カスタム抽出モデルをトレーニングしたら、必要に応じてテスト ドキュメントをトレーニング データセットにアップロードして、テスト ページを使用してモデルの品質を向上させます。

一部のラベルに対して低い信頼度スコアが返される場合は、コンテンツに正しくラベル付けされていることを確認します。 正しくない場合は、モデルの品質を改善するために、それらをトレーニング データセットに追加し再ラベル付けを行います。

トレーニング データセットにテスト ファイルを追加する方法を示すアニメーション化されたスクリーンショット。

カスタム プロジェクトでドキュメント リスト オプションとフィルターを使用する

カスタム抽出モデルのラベル付けページを使用すると、検索、フィルター、並べ替えの機能を使用して、トレーニング ドキュメントを簡単に確認できます。

グリッド ビューを使用してドキュメントをプレビューするか、リスト ビューを使用してドキュメントをより簡単にスクロールできます。

ドキュメント リスト ビューのオプションとフィルターを示すスクリーンショット。

プロジェクト共有

カスタム抽出プロジェクトを簡単に共有できます。 詳しくは、カスタム モデルを使用したプロジェクトの共有に関する記事をご覧ください。