LLM をいつ使用するか

完了

全体として、テキスト、画像、さらにはコードを生成する必要がある場合に、大規模言語モデルを使用することをお勧めします。

生成 AI モデルには、次の 3 つの異なるカテゴリがあります。

  • 自然言語モデルは自然言語 を受け取り、応答を生成します。
  • 生成事前トレーニング済みトランスフォーマー (GPT) モデル は、自然言語またはコード スニペットを受け取り、それらをコードに変換します。
  • イメージ生成モデル は、プロンプト、基本イメージ、またはその両方を受け取り、新しいイメージを作成します。

テキスト処理

大規模言語モデルでは、次のような複数の自然言語タスクを実行することができます。

タスク プロンプト
テキストの要約 "このテキストを短い宣伝文句に要約して。"
テキストの分類 「これはどんなジャンルの本ですか?
名前または語句の生成 "わたしの花屋のキャッチコピーを書いて。"
翻訳 "'お元気ですか' をフランス語に翻訳して。"
質問への回答 "Azure OpenAI は何をしますか?
コンテンツの提案 "ウェディング ソングのベスト 5 を教えて。"

コードを操作する

大規模言語モデルは、C#、JavaScript、Perl、PHP、Python など、十数個を超えるプログラミング言語に習熟しています。 LLM を使用してコードを書くと、次の課題を解決することができます。

  • アプリケーションのビルド: LLM を使用して、プロンプトに基づいて Web API のようなコードを生成できます。
  • アプリケーションの保守: 既存のコードベースで作業する場合、LLM は既存のコードを更新または保守するのに役立ちます。
  • アプリケーションの改善: LLM を使用して、セキュリティの強化やログ記録など、特定のメトリックのコードを改善できます。

たとえば、"Python で 1 から 10 までカウントする for ループを書いて" と入力で指定すると、次の応答が示されます。


for i in range(1,11):

    print(i)

画像処理

大規模言語モデルでは、現実的および芸術的な画像の両方を作成し、画像のレイアウトまたはスタイルを変更し、与えられた画像のバリエーションを作成することができます。 次に例を示します。

  • イメージの生成: LLM は、イメージを希望する内容の入力テキストを使用して、元のイメージを生成できます。 詳しく入力すればするほど、思い描いた画像をそのモデルが生成する可能性は高くなります。

  • イメージの編集: LLM は、イメージについて変更したい内容の入力テキストを使用してイメージを編集できます。 ある画像のスタイルを変更する、項目を追加または削除する、あるいは新しいコンテンツを生成して追加することができます。

  • 画像のバリエーション: LLM は、イメージ自体と、生成するイメージのバリエーションの数を指定する入力テキストを使用して、イメージのバリエーションを生成できます。 元の画像は変わりませんが、色、背景のシーン、オブジェクトが配置されている場所は、バリエーションによって変わる可能性があります。