要約とは何か

2025-04-21

重要

プレビューリージョンであるスウェーデン中部では、GPT モデルに基づいた最新かつ常に進化し続けている LLM の微調整の手法を確認できます。スウェーデン中部リージョンの Language リソースを使用して、それらをぜひお試しいただけます。

会話の概要作成は、以下を使用した場合にのみ利用可能です。

REST API
Python（プログラミング言語）
C#

概要作成は、 Azure AI Language によって提供される機能であり、生成的な大規模言語モデルとタスク最適化エンコーダーモデルの組み合わせであり、より高品質でコスト効率が高く、待機時間が短い要約ソリューションを提供します。この記事を使って、この機能の詳細と、アプリケーションでの使用方法について学習します。

このサービスは、プレーンテキスト、会話、ネイティブドキュメントの 3 種類のジャンルの要約ソリューションを提供します。テキスト要約では、プレーンテキストブロックのみを受け入れます。会話の要約は、さまざまな音声オーディオ信号を含む会話入力を受け入れます。ネイティブドキュメントの概要作成では、Word、PDF、プレーンテキストなどのネイティブ形式のドキュメントを受け入れます。詳細については、「サポートされているドキュメント形式」を参照してください。

ヒント

Azure AI Foundry ポータルで概要を試す。このサービスを使用するには、現在既存の Language Studio リソースを利用するか、新しい Azure AI Foundry リソースを作成できます。

資格

このドキュメントには、次の種類の記事が含まれています。

クイックスタートは、サービスに対する要求を実行するための開始手順を説明します。
攻略ガイドには、より具体的またはカスタマイズした方法でサービスを使用するための手順が記載されています。

一般的なワークフロー

この機能を使用するには、分析のためのデータを送信し、アプリケーションで API 出力を処理します。分析はそのままの状態で行われ、データに使用されるモデルに対して追加のカスタマイズは行われません。

Azure AI Language リソースを作成します。これにより、Azure AI Language によって提供される機能にアクセスできるようになります。 API 要求の認証に使用するパスワード (キーと呼ばれる) とエンドポイント URL が生成されます。
REST API か、C#、Java、JavaScript、Python のクライアントライブラリを使用して、要求を作成します。バッチ要求で非同期呼び出しを送信して、複数の機能の API 要求を 1 回の呼び出しに統合することもできます。
テキストデータを含む要求を送信します。キーとエンドポイントを使用して認証が行われます。
応答をローカルでストリームまたは保存します。

テキスト要約の主な機能

テキスト要約では、自然言語処理手法を使用して、ドキュメント、会話、または任意のテキストから取得できるプレーンテキストの概要を生成します。この API が提供する要約には、次の 2 つのアプローチがあります。

抽出要約: ソーステキスト内の顕著な文と、これらの文の配置情報を抽出して、概要を生成します。
- 複数の抽出された文: これらの文は、入力テキストの主な考え方をまとめて伝えます。入力テキストコンテンツから抽出された元の文です。
- ランクスコア: ランクスコアは、文がメイントピックと関連している度合いを示します。テキストの概要作成では、抽出された文がランク付けされ、表示順に返されるのか、順位に従って返されるのかを判断できます。たとえば、3 つの文の要約を要求した場合、抽出要約からはスコアが最も高い 3 つの文が返されます。
- 位置情報: 抽出された文の開始位置と長さ。
抽象的な要約: 元のソースから文を逐語的に抽出しない簡潔でコヒーレントな文または単語を含む要約を生成します。
- 要約テキスト: 抽象要約は、コンテキスト入力範囲ごとに要約を返します。長い入力はセグメント化される可能性があるため、コンテキスト入力範囲に対して要約テキストの複数のグループが返される可能性があります。
- コンテキスト入力範囲: 要約テキストの生成に使われた入力内の範囲。

例として、次のテキストの段落について考えてみます。

マイクロソフトでは、既存の技術を超えてAIを進化させるために、より包括的で人間中心のアプローチを採用して学習と理解を深める探求を行っています。私はAzure AIサービスの最高技術責任者として、この探求を現実のものにするために、素晴らしい科学者やエンジニアのチームと共に取り組んでいます。私の役割では、人間の認知の3つの特性、すなわち一言語のテキスト（X）、聴覚または視覚の感覚信号（Y）、および多言語（Z）の関係を独自の視点で見ることを楽しんでいます。 3つの要素が交わるところに、魔法があります。これを図1で示されているようにXYZコードと呼びます。これは、より強力なAIを生み出すための共同表現で、人間とより自然に話し、聞き、見て、理解することができます。私たちは、XYZ コードは、さまざまなモダリティと言語にまたがるクロスドメイン転移学習という長期的なビジョンを実現できると信じています。目標は、今日の人間のように、幅広い下流のAIタスクをサポートするための表現を共同で学習できる事前学習済みモデルを持つことです。過去5年間で、会話型音声認識、機械翻訳、会話型質問応答、機械読解力、画像キャプション作成におけるベンチマークで人間のパフォーマンスを達成しました。これらの5つのブレークスルーは、AIの能力の飛躍を生み出すという、より野心的な願望に向けて私たちに強い兆候を示しました。これは、人間が学んで理解する方法により近い、マルチセンサーおよび多言語学習の達成を目指しています。私は、外部のナレッジソースを基にした下流の AI タスクにおいて、XYZコードはこの願望を実現するための基礎的な構成要素であると考えています。

ドキュメント要約 API 要求は、要求を受信した時点で API バックエンド用のジョブを作成することで処理されます。ジョブが成功すると、API の出力が返されます。出力は 24 時間取得できます。この時間が過ぎると、出力は消去されます。多言語と絵文字のサポートにより、応答にはテキストオフセットが含まれる場合があります。詳細についてはオフセットの処理方法に関するページを参照してください。

上記の例を使用すると、API は次の概要を返す可能性があります。

抽出要約:

"Microsoft では、学習と解釈に対してより包括的で人間中心のアプローチを行うことで、既存の手法を超えて AI を発展させることを目指しています。"
"私たちは、XYZ コードは、さまざまなモダリティと言語にまたがるクロスドメイン転移学習という長期的なビジョンを実現できると信じています。"
"目標は、さまざまなダウンストリーム AI タスクをサポートするために、現在人間が行っているのとほぼ同様の方法で、表現を共同で学習できる一連の事前トレーニング済みモデルを獲得することです。"

抽象要約:

マイクロソフトは、学習と理解に対してより全体的で人間中心のアプローチを取っています。私たちは、XYZ コードは、さまざまなモダリティと言語にまたがるクロスドメイン転移学習という長期的なビジョンを実現できると信じています。過去 5 年間で、会話音声認識のベンチマークで人的パフォーマンスを達成しました。"

このドキュメントには、次の種類の記事が含まれています。

クイックスタートは、サービスに対する要求を実行するための開始手順を説明します。
攻略ガイドには、より具体的またはカスタマイズした方法でサービスを使用するための手順が記載されています。

会話要約の主な機能

会話要約では、次の機能がサポートされています。

まとめ: 会話を簡単な段落にまとめます。
問題と解決策の要約: コールセンター固有の機能であり、顧客サービスエージェントと顧客との間の会話の問題と解決策の要約を提供します。
章のタイトルの概要: 会話で説明したトピックに基づいて会話を章に分割し、入力会話の推奨される章のタイトルを提供します。
物語要約: 入力会話の詳細な通話メモ、会議メモ、またはチャット概要を生成します。

例として、次の会話の例を考えます。

エージェント: "こんにちは、Rene と申します。どのようなご用件ですか?"

顧客: "こんにちは、Smart Brew 300 エスプレッソマシンの WiFi 接続を設定しようとしましたが、うまくいきませんでした。"

エージェント: "申し訳ありません。問題解決のためにできることをお調べします。WiFi 接続ボタンを押して、3 秒待ってから、電源ライトがゆっくりと点滅しているかどうかをお知らせください。"

顧客: "はい、Wifi 接続ボタンを押したら、電源ライトがゆっくりと点滅しています。"

エージェント: "わかりました。ありがとうございます。次に、Contoso Coffee アプリを確認してください。マシンに接続するように求めるメッセージが表示されますか?"

顧客: "いいえ。何も起こりませんでした。"

エージェント: "そうですか。よろしくお願いいたします。ファクトリリセットで問題を解決できるか試してみましょう。センターボタンを 5 秒間長押しして、ファクトリリセットを開始してください。"

顧客: "ファクトリリセットを試し、上記の手順をもう一度実行しましたが、やはりうまくいきませんでした。"

エージェント: "申し訳ありません。他に問題の解決方法があるかどうか確認いたします。少々お待ちください。"

会話要約機能を使用すると、テキストが次のように簡略化されます。

概要の例	注釈	会話の側面
顧客が Smart Brew 300 エスプレッソマシンの WiFi 接続を設定できません	顧客とエージェントの会話中に発生した顧客の問題	イシュー
エージェントは、WiFi 接続の確認、Contoso Coffee アプリの確認、出荷時の設定へのリセットの実行などの、いくつかのトラブルシューティング手順を提案しました。しかし、これらのどの手順でも問題が解決しませんでした。次にエージェントは、顧客との会話を保留して別の解決策を探します。	顧客とエージェントの会話で試行された解決策	解決策
顧客は、Smart Brew 300 エスプレッソマシンの WiFi 接続の設定に関するサポートをエージェントに依頼しました。エージェントは、WiFi 接続の確認、電源ライトの確認、出荷時の設定へのリセットなどの、いくつかのトラブルシューティング手順を顧客に案内しました。これらの手順に従ったにもかかわらず、問題が解決しません。次にエージェントは、他の潜在的な解決策を調査することにしました	会話を 1 つの段落に要約します	まとめ
SmartBrew 300 エスプレッソマシンのトラブルシューティング	会話をセグメント化し、セグメントごとにタイトルを生成します。通常、`narrative` 側面と連携します	章タイトル
顧客は、Smart Brew 300 エスプレッソマシンの WiFi 接続について問題を抱えています。エージェントは、出荷時の設定へのリセットを含む複数の解決策を提案しますが、問題が解決しません。	会話をセグメント化し、セグメントごとに要約を生成します。通常、`chapterTitle` 側面と連携します	物語

このドキュメントには、次の種類の記事が含まれています。

クイックスタートは、サービスに対する要求を実行するための開始手順を説明します。
攻略ガイドには、より具体的またはカスタマイズした方法でサービスを使用するための手順が記載されています。

ネイティブドキュメントの要約では、自然言語処理手法を使用してネイティブドキュメントの概要を生成します。ネイティブドキュメントとは、Microsoft Word (docx) やポータブルドキュメントファイル (pdf) などの元のドキュメントを作成するために使われるファイル形式のことです。ネイティブドキュメントのサポートにより、Azure AI Language リソースの機能を使用する前に、テキストの前処理を行う必要がなくなります。現在、ネイティブドキュメントのサポートは、次の 2 種類の要約で利用できます。

抽出要約: ドキュメント内の顕著な文を抽出し、それらの文の配置情報を一緒に抽出して、要約を生成します。
- 抽出された複数の文: これらの文は、ドキュメントの主要なアイデアをまとめて伝えます。これらは、入力ドキュメントのコンテンツから抽出された元の文です。
- ランクスコア: ランクスコアは、文がメイントピックと関連している度合いを示します。テキストの概要作成では、抽出された文がランク付けされ、表示順に返されるのか、順位に従って返されるのかを判断できます。たとえば、3 つの文の要約を要求した場合、抽出要約からはスコアが最も高い 3 つの文が返されます。
- 位置情報: 抽出された文の開始位置と長さ。
抽象要約: 簡潔で一貫性がある文や単語を使用して、元のドキュメントそのままの抽出文ではない要約を生成します。
- 要約テキスト: 抽象要約は、コンテキスト入力範囲ごとに要約を返します。長い入力はセグメント化される可能性があるため、コンテキスト入力範囲に対して要約テキストの複数のグループが返される可能性があります。
- コンテキスト入力範囲: 要約テキストの生成に使われた入力内の範囲。

現在、 ドキュメント要約 では、次のネイティブドキュメント形式がサポートされています。

ファイルの種類	[ファイル拡張子]	説明
テキスト	`.txt`	書式設定のないテキストドキュメント。
Adobe PDF	`.pdf`	移植可能なドキュメントファイル形式のドキュメント。
マイクロソフトワード	`.docx`	Microsoft Word 文書ファイル。

詳細については、「ネイティブドキュメントの要約」を参照してください。

サマリーの作成を始める

概要作成を使用するには、分析のために送信し、お使いのアプリケーションで API 出力を処理します。分析はそのままの状態で行われ、データに使用されるモデルに対して追加のカスタマイズは行われません。概要作成を使用するには、次の 2 つの方法があります。

開発オプション	説明
Azure AI Foundry	Azure AI Foundry は Web ベースのプラットフォームであり、サインアップしたら独自のデータを含むテキストの例で、エンティティリンク設定を使用することができます。詳細については、Azure AI Foundry の Web サイトまたは Azure AI Foundry のドキュメントを参照してください。
REST API またはクライアントライブラリ (Azure SDK)	さまざまな言語で使用できる REST API ライブラリ、またはクライアントライブラリを使用して、テキスト要約をアプリケーションに統合します。詳しくは、概要作成のクイックスタートに関する記事をご覧ください。

開発オプション	説明	リンク
REST API	REST API を使用して、会話の概要作成をアプリケーションに統合します。	クイックスタート: 会話の概要作成を使用する

開発オプション	説明
Azure AI Foundry	Azure AI Foundry は Web ベースのプラットフォームであり、サインアップしたら独自のデータを含むテキストの例で、エンティティリンク設定を使用することができます。詳細については、Azure AI Foundry の Web サイトまたは Azure AI Foundry のドキュメントを参照してください。
REST API またはクライアントライブラリ (Azure SDK)	さまざまな言語で使用できる REST API ライブラリ、またはクライアントライブラリを使用して、テキスト要約をアプリケーションに統合します。詳しくは、概要作成のクイックスタートに関する記事をご覧ください。

入力要件とサービスの制限

概要作成では、分析のためにテキストが使用されます。詳細については、攻略ガイドのデータとサービスの制限に関する記事を参照してください。
概要作成は、さまざまな書記言語で動作します。詳細については、「言語サポート」を参照してください。

リファレンスドキュメントとコードサンプル

アプリケーションでテキスト要約を使用する場合は、Azure AI Language の次のリファレンスドキュメントとサンプルを参照してください。

開発オプション/言語	リファレンスドキュメント	サンプル
C#	C# 関連のドキュメント	C# のサンプル
ジャワ	Java のドキュメント	Java のサンプル
JavaScript	JavaScript のドキュメント	JavaScript のサンプル
Python（プログラミング言語）	Python のドキュメント	Python のサンプル

責任ある AI

AI システムには、テクノロジだけでなく、それを使用する人、それによって影響を受ける人、デプロイ環境も含まれます。システムでの責任ある AI の使用および展開について学ぶために、要約のための透明性に関するメモをご覧ください。詳細については、次の記事をご覧ください。

次の方法で共有

要約とは何か

資格

一般的なワークフロー

テキスト要約の主な機能

サマリーの作成を始める

入力要件とサービスの制限

リファレンス ドキュメントとコード サンプル

責任ある AI

フィードバック

その他のリソース

リファレンスドキュメントとコードサンプル