LLM をいつ使用するか
全体として、テキスト、画像、さらにはコードを生成する必要がある場合に、大規模言語モデルを使用することをお勧めします。
生成 AI モデルには、次の 3 つの異なるカテゴリがあります。
- 自然言語モデルは自然言語 を受け取り、応答を生成します。
- 生成事前トレーニング済みトランスフォーマー (GPT) モデル は、自然言語またはコード スニペットを受け取り、それらをコードに変換します。
- イメージ生成モデル は、プロンプト、基本イメージ、またはその両方を受け取り、新しいイメージを作成します。
テキスト処理
大規模言語モデルでは、次のような複数の自然言語タスクを実行することができます。
タスク | プロンプト |
---|---|
テキストの要約 | "このテキストを短い宣伝文句に要約して。" |
テキストの分類 | 「これはどんなジャンルの本ですか? |
名前または語句の生成 | "わたしの花屋のキャッチコピーを書いて。" |
翻訳 | "'お元気ですか' をフランス語に翻訳して。" |
質問への回答 | "Azure OpenAI は何をしますか? |
コンテンツの提案 | "ウェディング ソングのベスト 5 を教えて。" |
コードを操作する
大規模言語モデルは、C#、JavaScript、Perl、PHP、Python など、十数個を超えるプログラミング言語に習熟しています。 LLM を使用してコードを書くと、次の課題を解決することができます。
- アプリケーションのビルド: LLM を使用して、プロンプトに基づいて Web API のようなコードを生成できます。
- アプリケーションの保守: 既存のコードベースで作業する場合、LLM は既存のコードを更新または保守するのに役立ちます。
- アプリケーションの改善: LLM を使用して、セキュリティの強化やログ記録など、特定のメトリックのコードを改善できます。
たとえば、"Python で 1 から 10 までカウントする for ループを書いて" と入力で指定すると、次の応答が示されます。
for i in range(1,11):
print(i)
画像処理
大規模言語モデルでは、現実的および芸術的な画像の両方を作成し、画像のレイアウトまたはスタイルを変更し、与えられた画像のバリエーションを作成することができます。 次に例を示します。
イメージの生成: LLM は、イメージを希望する内容の入力テキストを使用して、元のイメージを生成できます。 詳しく入力すればするほど、思い描いた画像をそのモデルが生成する可能性は高くなります。
イメージの編集: LLM は、イメージについて変更したい内容の入力テキストを使用してイメージを編集できます。 ある画像のスタイルを変更する、項目を追加または削除する、あるいは新しいコンテンツを生成して追加することができます。
画像のバリエーション: LLM は、イメージ自体と、生成するイメージのバリエーションの数を指定する入力テキストを使用して、イメージのバリエーションを生成できます。 元の画像は変わりませんが、色、背景のシーン、オブジェクトが配置されている場所は、バリエーションによって変わる可能性があります。