生成 AI: 新しいコンテンツを作成する

予測 AI は既存のデータから分析情報を抽出しますが、生成 AI はさらに一歩進んで新しいものを作成します。テキストの作成、画像の生成、コードの作成、ユーザー インターフェース全体の設計などを行うことができます。生成 AI の一般的なユースケースの例を次に示します。

  • コンテンツの作成: AI 文書作成アシスタントは、下書きの作成や既存のテキストの推敲を行うことができます。
  • 要約: Google AI による概要などのツールは、長いドキュメント、会議、ウェブページを簡潔で実用的な要約にまとめます。
  • コード生成: デベロッパー ツールは生成 AI を使用してコードを記述およびリファクタリングし、デベロッパーの生産性を向上させます。
  • 画像とアセットの作成: ビジョン モデルを使用して、バナーやサムネイルなどのビジュアル アセットを作成できます。

生成 AI ループ

ほとんどの生成 AI モデルは、ニューラル ネットワークトランスフォーマー アーキテクチャを使用してトレーニングされます。モデルは、前の要素に基づいて、次の単語、ピクセル、音符などのシーケンス内の次の要素を提案することを学習します。

数学的には、これは予測 AI とそれほど変わりません。どちらもデータからパターンを学習します。違いは規模にあります。

予測 AI では、出力オプションは「解約」や「解約なし」などのラベルに限定されます。生成 AI では、出力スペースに数十万ものオプションを含めることができます。数十億件の例でトレーニングされた予測メカニズムは、新しい未知の出力を生成できる強力なエンジンに進化します。

生成 AI システムの開発は、反復的なアプローチで行われます。

各ステップは、連続した円の中で次のステップを指しています。
図 1. 予測 AI ループと同様に、まずユースケースを定義します。ループは各ステップを反復処理して、再び開始します。

ここでは、ユーザーがキャッチーな説明や SEO に適した記事のタイトルを生成するのに役立つコンテンツ管理システム アシスタントであるサンプル アプリケーション BlogBuddy を使用して、この仕組みについて説明します。

ユースケースを定義する

BlogBuddy AI システムのブループリント。
図 2. Blogbuddy アプリケーションのシステム ブループリント。フルサイズの図を開きます

問題文には次の内容を含める必要があります。

  • 入力と出力のモダリティ。テキスト(文章またはコード)、画像、音声などがあります。
  • 入力方法。コンテンツはアップロード フィールド、フリーテキスト、その他の構造入力から取得されましたか?
  • オーディエンス。このタスクを実行するユーザー一般的な知識が必要か、専門的な知識が必要か。

BlogBuddy の機能はテキスト生成を中心に展開されます。入力は半構造化されています。ユーザーがトピックまたは短い下書きを指定すると、モデルがバリエーションを返します。対象読者はマーケティング担当者で、編集に関する専門知識を持っています。

出力の品質基準を設定することが重要です。この例では、パブリケーションのトーンに合った、短くスキャン可能なキーワードを豊富に含むテキストを生成します。

明確な成功指標は、残りのプロセスを導くのに役立ちます。成功指標の収集については、評価主導の開発をご覧ください。

ベースモデルを選択する

大規模なユニバーサル データセットで事前トレーニングされたモデルが幅広く用意されています。特定のニーズに合わせて動作を調整できます。生成 AI モデルは通常、予測モデルよりもはるかに大きく複雑であるため、独自のモデルを構築してトレーニングするのではなく、既存のモデルをベースに構築することをおすすめします。

この選択によって、プロダクトの機能、費用、カスタマイズ性、プライバシーの境界が決まります。モデルの選択は、AI システムをデプロイするプラットフォームと密接に関連しています。

このコースの後半では、プラットフォームの選択方法について学習します。

プロンプトとコンテキストのエンジニアリング

モデルを選択したら、プロンプトを使用して適切な指示を入力する必要があります。BlogBuddy の場合、モデルに次のようにプロンプトを表示します。

Generate three short, engaging title suggestions for this article

プロンプトに追加できる情報の種類は複数あります。次に例を示します。

  • 一般的な動作を設定するシステム プロンプト。
  • 現在のタスクの入力固有のコンテキスト。
  • チャットボットやエージェントなどの会話型アプリケーションのユーザー向け手順。

推論と後処理

プロンプトが組み立てられると、推論のためにモデルに送信されます。温度(創造性)やトークンの最大数(長さと冗長性)などのモデル パラメータを変更して、モデルの応答方法を調整できます。生成後、出力は追加のルールとガードレールで処理されることがよくあります。

たとえば、性別に関するテキストの言い換え、トーンの調整、禁止用語のフィルタリングなどを行うことができます。

透明性と信頼性の調整をサポートするために、結果を分類または要約する小さなセカンダリ モデルを追加できます。例: 「12 個の関連する記事から生成された導入文。信頼度: 高。

評価とフィードバック ループ

生成 AI の出力スペースは事実上無限であるため、ほとんどのプロンプトには正解が 1 つだけではありません。MMLUSQuAD などの標準化されたベンチマークは、一般的なモデルの能力を測定できますが、人間のユーザーの特定のニーズを捉えることはほとんどありません。プロダクトのコンテキストでは、定性的指標と定量的指標の独自の組み合わせを定義する必要があります。

  • 正確性: 出力は事実に基づいて正しいか。
  • 有用性: 出力は、プロンプトまたはユーザーの意図によって設定された期待を満たしていますか?
  • 読みやすさとトーン: 出力は明確で、ブランド基準に沿っていますか?
  • 人間の労力: 手動での編集やキュレーションはどの程度必要ですか?
  • ドメインの理解: 出力にドメイン固有の知識が反映されているか?

これらの指標を評価するには、人間によるレビューと自動スコアリングを組み合わせます。たとえば、ユーザーに実際の出力を評価してもらったり、自動評価に別のモデル(LLM-as-a-judge とも呼ばれます)を使用したり、バイアスやハルシネーションについて定期的に内部レビューを実施したりできます。

生成 AI を活用した構築において、実際の使用状況データは最大の資産の一つです。可能であれば、これらのインタラクションをログに記録して、プロンプトとコンテキストの調整、さまざまなモデルのテスト、パラメータの経時的な調整を行います。ユーザーの操作、修正、評価は、次の最適化手順を決定するのに役立つフィードバックになります。

  • 予期しないユーザー入力は、正しい問題の解決に取り組んでいるかどうかを判断するのに役立ちます。
  • ドメイン固有の定期的なリクエストは、モデルの選択に役立ちます。大規模な汎用 LLM から小規模なファインチューニング済みモデルに切り替えることができます。
  • ハルシネーションが頻繁に発生する場合は、プロンプトに特定のコンテキストが不足している可能性があります。
  • 大幅な編集は、共有コンテキストが不十分であることを示している可能性があります。モデルは、ユーザーが当然のことと認識している情報を認識していません。

これらのフィードバック ループにより、生成 AI 機能は静的モデル呼び出しから、ユーザーのニーズや好みに継続的に適応する動的システムに変換されます。

一般的な問題と軽減策

生成 AI は入力と出力のオープンエンドな空間で動作するため、リスク サーフェスは予測システムよりもはるかに広範囲になります。不正確な出力を生成するだけでなく、有害なコンテンツ、偏ったコンテンツ、誤解を招くコンテンツを生成したり、ユーザーを意図せずに操作したりする可能性もあります。このような障害が発生すると、信頼が損なわれ、財務的または法的影響を受ける可能性があります。

そのため、生成 AI には予防的かつ継続的なリスク管理アプローチが必要です。最も一般的なリスクは次のとおりです。

  • ハルシネーション: モデルが事実を捏造したり、詳細を誤って述べたりします。この問題を軽減するには、事実に基づくグラウンディングに RAG を使用します。
  • 過信: ユーザーが出力を常に正しいと想定する。この問題を軽減するには、自動公開ではなく、レビューと編集のフローを推奨します。AI ガバナンス: 責任ある構築では、ユーザーの信頼度を調整する方法について説明します。
  • 不整合: 出力が実行ごとに大きく異なる。軽減するには、プロンプト テンプレート、温度制御、少数ショットの例を使用して、トーンと構造を安定させます。
  • 有害なコンテンツ: モデルがバイアスのあるテキスト、不適切なテキスト、操作的なテキストを生成する。軽減するには、表示前にモデレーション フィルタと有害性分類子を適用します。実際のプロンプトを使用して出力を継続的にテストし、フィードバック ループを維持して、エッジケースを特定して再トレーニングします。
  • レイテンシと費用: 大規模なモデルは、処理が遅く、費用が高くなる可能性があります。特に大規模な導入を目指す場合は、モデルの費用とリソース使用量を事前に見積もることが難しい場合があります。軽減するには、短いタスクにキャッシュ保存、バッチ処理、小さいモデルを使用します。

要点

簡単に言うと、生成 AI は、アイデアをテキスト、画像、コード、会話などの具体的なコンテンツに変換します。精度よりも創造性と適応性が重視される場合に適しています。

ウェブ デベロッパーの成功は、適切なプロンプトの設計、適切なデータに基づくモデルのグラウンディング、ユーザーの好みに合わせたシステムの継続的な調整にかかっています。

リソース

小規模で持続可能なモデルの選択について確認する。より高度な学習:

理解度を確認する

生成 AI と予測 AI の出力の主な違いは何ですか?

生成 AI の出力は、「解約」や「解約なし」などの少数のラベルに限定されます。
不正解です。
生成 AI は、オプションの出力スペース(テキスト、ピクセル、コード)から新しいコンテンツを作成します。
正解です。
生成 AI は数値予測にのみ使用されます。
不正解です。
生成 AI は、データのパターンを学習するためにデータを使用しません。
不正解です。

モデルの温度の役割は何ですか?

モデルのレスポンスのランダム性を制御します。
不正解です。
モデルの回答の創造性を調整します。
正解です。
禁止用語は除外されます。
不正解です。
モデルの速度が向上します。
不正解です。

標準化されたベンチマークが生成 AI の評価に十分でないことが多いのはなぜですか?

実行コストが高すぎる。
不正解です。
人間のユーザーの具体的なニーズやプロダクトの意図を捉えることはほとんどありません。
正解です。
これらは画像生成にのみ使用でき、テキストには使用できません。
不正解です。
最新のモデルでは簡単に合格できます。
不正解です。

ハルシネーションの一般的な緩和策は次のうちどれですか?

事実に基づくグラウンディングには、RAG(Retrieval-Augmented Generation)などの手法を使用します。
正解です。
モデルの温度を上げて、よりクリエイティブにする。
不正解です。
AI の使用を停止し、手動でのコンテンツ作成に切り替えます。
このようなことは起こり得ますが、モデルがより正確な出力を生成するのに役立つ方法ではありません。
出力が不審な場合は、ユーザーに表示しないようにします。
誤った情報がユーザーに届かないようにすることはできますが、幻覚が続く問題は解決されません。

生成 AI ループによると、ユーザー フィードバックはどのように処理する必要がありますか?

プライバシー保護のため、すぐに削除してください。
不正解です。
これを使用して、問題の定義、モデルの選択、プロンプトを調整します。
正解です。
別のデータベースに保存して、二度と確認しない。
不正解です。
モデルの不正な動作に対するペナルティとしてのみ使用します。
不正解です。