次の方法で共有


要約とは何か

重要

プレビュー リージョンであるスウェーデン中部では、GPT モデルに基づいた最新かつ常に進化し続けている LLM の微調整の手法を確認できます。 スウェーデン中部リージョンの Language リソースを使用して、それらをぜひお試しいただけます。

会話の概要作成は、以下を使用した場合にのみ利用可能です。

  • REST API
  • Python(プログラミング言語)
  • C#

概要作成は、 Azure AI Language によって提供される機能であり、生成的な大規模言語モデルとタスク最適化エンコーダー モデルの組み合わせであり、より高品質でコスト効率が高く、待機時間が短い要約ソリューションを提供します。 この記事を使って、この機能の詳細と、アプリケーションでの使用方法について学習します。

このサービスは、プレーン テキスト、会話、ネイティブ ドキュメントの 3 種類のジャンルの要約ソリューションを提供します。 テキスト要約では、プレーン テキスト ブロックのみを受け入れます。 会話の要約は、さまざまな音声オーディオ信号を含む会話入力を受け入れます。 ネイティブ ドキュメントの概要作成では、Word、PDF、プレーン テキストなどのネイティブ形式のドキュメントを受け入れます。 詳細については、「サポートされているドキュメント形式」を参照してください

資格

このドキュメントには、次の種類の記事が含まれています。

  • クイックスタートは、サービスに対する要求を実行するための開始手順を説明します。
  • 攻略ガイドには、より具体的またはカスタマイズした方法でサービスを使用するための手順が記載されています。

一般的なワークフロー

この機能を使用するには、分析のためのデータを送信し、アプリケーションで API 出力を処理します。 分析はそのままの状態で行われ、データに使用されるモデルに対して追加のカスタマイズは行われません。

  1. Azure AI Language リソースを作成します。これにより、Azure AI Language によって提供される機能にアクセスできるようになります。 API 要求の認証に使用するパスワード (キーと呼ばれる) とエンドポイント URL が生成されます。

  2. REST API か、C#、Java、JavaScript、Python のクライアント ライブラリを使用して、要求を作成します。 バッチ要求で非同期呼び出しを送信して、複数の機能の API 要求を 1 回の呼び出しに統合することもできます。

  3. テキスト データを含む要求を送信します。 キーとエンドポイントを使用して認証が行われます。

  4. 応答をローカルでストリームまたは保存します。

テキスト要約の主な機能

テキスト要約では、自然言語処理手法を使用して、ドキュメント、会話、または任意のテキストから取得できるプレーン テキストの概要を生成します。 この API が提供する要約には、次の 2 つのアプローチがあります。

  • 抽出要約: ソース テキスト内の顕著な文と、これらの文の配置情報を抽出して、概要を生成します。

    • 複数の抽出された文: これらの文は、入力テキストの主な考え方をまとめて伝えます。 入力テキスト コンテンツから抽出された元の文です。
    • ランク スコア: ランク スコアは、文がメイン トピックと関連している度合いを示します。 テキストの概要作成では、抽出された文がランク付けされ、表示順に返されるのか、順位に従って返されるのかを判断できます。 たとえば、3 つの文の要約を要求した場合、抽出要約からはスコアが最も高い 3 つの文が返されます。
    • 位置情報: 抽出された文の開始位置と長さ。
  • 抽象的な要約: 元のソースから文を逐語的に抽出しない簡潔でコヒーレントな文または単語を含む要約を生成します。

    • 要約テキスト: 抽象要約は、コンテキスト入力範囲ごとに要約を返します。 長い入力はセグメント化される可能性があるため、コンテキスト入力範囲に対して要約テキストの複数のグループが返される可能性があります。
    • コンテキスト入力範囲: 要約テキストの生成に使われた入力内の範囲。

例として、次のテキストの段落について考えてみます。

マイクロソフトでは、既存の技術を超えてAIを進化させるために、より包括的で人間中心のアプローチを採用して学習と理解を深める探求を行っています。 私はAzure AIサービスの最高技術責任者として、この探求を現実のものにするために、素晴らしい科学者やエンジニアのチームと共に取り組んでいます。 私の役割では、人間の認知の3つの特性、すなわち一言語のテキスト(X)、聴覚または視覚の感覚信号(Y)、および多言語(Z)の関係を独自の視点で見ることを楽しんでいます。 3つの要素が交わるところに、魔法があります。これを図1で示されているようにXYZコードと呼びます。これは、より強力なAIを生み出すための共同表現で、人間とより自然に話し、聞き、見て、理解することができます。 私たちは、XYZ コードは、さまざまなモダリティと言語にまたがるクロスドメイン転移学習という長期的なビジョンを実現できると信じています。 目標は、今日の人間のように、幅広い下流のAIタスクをサポートするための表現を共同で学習できる事前学習済みモデルを持つことです。 過去5年間で、会話型音声認識、機械翻訳、会話型質問応答、機械読解力、画像キャプション作成におけるベンチマークで人間のパフォーマンスを達成しました。 これらの5つのブレークスルーは、AIの能力の飛躍を生み出すという、より野心的な願望に向けて私たちに強い兆候を示しました。これは、人間が学んで理解する方法により近い、マルチセンサーおよび多言語学習の達成を目指しています。 私は、外部のナレッジ ソースを基にした下流の AI タスクにおいて、XYZコードはこの願望を実現するための基礎的な構成要素であると考えています。

ドキュメント要約 API 要求は、要求を受信した時点で API バックエンド用のジョブを作成することで処理されます。 ジョブが成功すると、API の出力が返されます。 出力は 24 時間取得できます。 この時間が過ぎると、出力は消去されます。 多言語と絵文字のサポートにより、応答にはテキスト オフセットが含まれる場合があります。 詳細についてはオフセットの処理方法に関するページを参照してください。

上記の例を使用すると、API は次の概要を返す可能性があります。

抽出要約:

  • "Microsoft では、学習と解釈に対してより包括的で人間中心のアプローチを行うことで、既存の手法を超えて AI を発展させることを目指しています。"
  • "私たちは、XYZ コードは、さまざまなモダリティと言語にまたがるクロスドメイン転移学習という長期的なビジョンを実現できると信じています。"
  • "目標は、さまざまなダウンストリーム AI タスクをサポートするために、現在人間が行っているのとほぼ同様の方法で、表現を共同で学習できる一連の事前トレーニング済みモデルを獲得することです。"

抽象要約:

  • マイクロソフトは、学習と理解に対してより全体的で人間中心のアプローチを取っています。 私たちは、XYZ コードは、さまざまなモダリティと言語にまたがるクロスドメイン転移学習という長期的なビジョンを実現できると信じています。 過去 5 年間で、会話音声認識のベンチマークで人的パフォーマンスを達成しました。"

サマリーの作成を始める

概要作成を使用するには、分析のために送信し、お使いのアプリケーションで API 出力を処理します。 分析はそのままの状態で行われ、データに使用されるモデルに対して追加のカスタマイズは行われません。 概要作成を使用するには、次の 2 つの方法があります。

開発オプション 説明
Azure AI Foundry Azure AI Foundry は Web ベースのプラットフォームであり、サインアップしたら独自のデータを含むテキストの例で、エンティティ リンク設定を使用することができます。 詳細については、Azure AI Foundry の Web サイトまたは Azure AI Foundry のドキュメントを参照してください。
REST API またはクライアント ライブラリ (Azure SDK) さまざまな言語で使用できる REST API ライブラリ、またはクライアント ライブラリを使用して、テキスト要約をアプリケーションに統合します。 詳しくは、概要作成のクイックスタートに関する記事をご覧ください。

入力要件とサービスの制限

  • 概要作成では、分析のためにテキストが使用されます。 詳細については、攻略ガイドのデータとサービスの制限に関する記事を参照してください。
  • 概要作成は、さまざまな書記言語で動作します。 詳細については、「言語サポート」を参照してください。

リファレンス ドキュメントとコード サンプル

アプリケーションでテキスト要約を使用する場合は、Azure AI Language の次のリファレンス ドキュメントとサンプルを参照してください。

開発オプション/言語 リファレンス ドキュメント サンプル
C# C# 関連のドキュメント C# のサンプル
ジャワ Java のドキュメント Java のサンプル
JavaScript JavaScript のドキュメント JavaScript のサンプル
Python(プログラミング言語) Python のドキュメント Python のサンプル

責任ある AI

AI システムには、テクノロジだけでなく、それを使用する人、それによって影響を受ける人、デプロイ環境も含まれます。 システムでの責任ある AI の使用および展開について学ぶために、要約のための透明性に関するメモをご覧ください。 詳細については、次の記事をご覧ください。