公開日: 2024 年 2 月 17 日、最終更新日: 2025 年 4 月 22 日
人工知能(AI)には、かつては人間の入力が必要だったが、現在はコンピュータで実行できる、多くの複雑な新技術が含まれます。広義に言えば、AI は、幅広い問題解決と創造性を発揮する人間以外のプログラム、モデル、コンピュータです。コンピュータは高度な機能を実行できます。これまで、この機能は情報を理解して推奨するために使用されていました。生成 AI では、コンピュータが新しいコンテンツを生成することもできます。
AI という略語は、人工知能の分野におけるさまざまな種類のテクノロジーを示すために同じ意味で使用されることがよくありますが、AI の機能は大きく異なります。
ウェブで実践する AI の用語とコンセプトをいくつかご紹介します。機械学習の詳細については、機械学習の用語集をご覧ください。
AI の仕組みについて教えて。
トレーニングはすべてのモデルの最初のステップです。機械学習エンジニアは、モデルに特定の入力を与え、最適な出力を示すアルゴリズムを構築します。ウェブ デベロッパーは、このステップを実行する必要はありませんが、特定のモデルがどのようにトレーニングされたかを理解することは有益です。モデルのファインチューニングは可能ですが、タスクに最適なモデルを選択する方が時間の節約になります。
推論とは、モデルが新しいデータに基づいて結論を導き出すプロセスです。特定の分野でモデルのトレーニングを多く行うほど、推論によって有用で正しい出力が生成される可能性が高くなります。ただし、モデルがどれほどトレーニングを受けていても、完全な推論が保証されるわけではありません。
たとえば、Green Light は、Google マップのデータを基にトレーニングされた AI モデルを使用して、交通パターンを把握します。より多くのデータが受信されると、推論が実行され、信号機を最適化するための推奨事項が提供されます。
AI はどこで実行されますか?
AI トレーニングは、モデルがリリースされる前に完了します。さらなるトレーニングにより、機能や精度が向上した新しいバージョンのモデルが作成される場合があります。
ウェブ デベロッパーは、AI 推論が実行される場所に注意する必要があります。AI の使用コストは、推論に大きく影響されます。1 つのモデルの機能範囲も大きく影響を受けます。
クライアントサイド AI
ウェブ上の AI 機能のほとんどはサーバーに依存していますが、クライアントサイド AI はユーザーのブラウザで実行され、ユーザーのデバイスで推論を行います。これにより、レイテンシの短縮、サーバーサイドの費用の削減、API キーの要件の削除、ユーザーのプライバシーの強化、オフライン アクセスが可能になります。Transformers.js、TensorFlow.js、MediaPipe などの JavaScript ライブラリを使用して、ブラウザ間で動作するクライアントサイド AI を実装できます。
特にパフォーマンスを重視して最適化されている場合、小さな最適化済みクライアントサイド モデルが、より大きなサーバーサイド モデルよりも優れたパフォーマンスを発揮することがあります。ユースケースを評価して、最適なソリューションを決定します。
サーバーサイド AI
サーバーサイド AI には、クラウドベースの AI サービスが含まれます。Gemini 1.5 Pro がクラウド上で実行されていると考えてください。これらのモデルは、はるかに大きく、より強力な傾向があります。これは特に大規模言語モデルに当てはまります。
ハイブリッド AI
ハイブリッド AI とは、クライアント コンポーネントとサーバー コンポーネントの両方を含むソリューションのことです。たとえば、クライアントサイド モデルを使用してタスクを実行し、タスクをデバイスで完了できない場合はサーバーサイド モデルにフォールバックできます。
機械学習(ML)
ML(機械学習)とは、明示的なプログラミングなしでコンピュータが学習し、タスクを実行するプロセスです。AI が知性を生成しようとしているのに対し、ML はデータセットの予測を行うアルゴリズムで構成されています。
たとえば、特定の日付の天気を評価するウェブサイトを作成するとします。従来、この作業は 1 人以上の気象学者が行います。気象学者は、地球の大気と地表の表現を作成し、気象パターンを計算して予測し、現在のデータを過去の状況と比較して評価を決定します。
代わりに、ML モデルに大量の気象データを提供して、気象パターン、過去のデータ、特定の日に天候が良好または悪くなる原因に関するガイドラインとの間の数学的な関係をモデルが学習するまで待つことができます。実際、これはウェブ上に構築されています。
生成 AI と大規模言語モデル
生成 AI は、ユーザーが人間が作成したコンテンツに似た、親しみやすいコンテンツを作成できるようにする ML の一種です。生成 AI は、大規模言語モデルを使用してデータを整理し、提供されたコンテキストに基づいてテキスト、画像、動画、音声を作成または変更します。生成 AI は、パターン マッチングと予測を超えています。
大規模言語モデル(LLM)には、テキストや画像の生成、分類、要約など、さまざまなタスクの実行に使用できる多数(多くの場合数十億)のパラメータがあります。
chatbot は、次のような生成 AI を使用するための非常に人気のあるツールになっています。
これらのツールを使用すると、文章、コードサンプル、アートワークを作成できます。たとえば、休暇の計画、メールの文面の柔らかさやプロフェッショナルな表現の調整、さまざまな情報セットのカテゴリ分類などに役立ちます。
デベロッパーとデベロッパー以外のユーザーのユースケースは数え切れません。
ディープ ラーニング
ディープラーニング(DL)は ML アルゴリズムの一種です。たとえば、人間の脳が情報を処理する方法のモデル化を試みるディープ ニューラル ネットワーク(DNN)があります。
ディープラーニング アルゴリズムは、画像内の特定の特徴を特定のラベルまたはカテゴリに関連付けるようにトレーニングできます。トレーニングが完了すると、アルゴリズムは新しい画像で同じカテゴリを識別する予測を行うことができます。たとえば、Google フォトは写真内の猫と犬の違いを識別できます。
自然言語処理(NLP)
自然言語処理は、特定の言語のルールから、個人が使用する固有の表現、方言、スラングまで、コンピュータが人間の言語を理解できるようにすることに重点を置いた ML のクラスです。
AI の課題
AI の構築と使用には、いくつかの課題があります。以下に、考慮すべき点をいくつか示します。
データの品質と更新頻度
さまざまな AI モデルのトレーニングに使用される大規模なデータセットは、使用後すぐに古くなることがよくあります。つまり、最新情報を探す場合は、プロンプト エンジニアリングを使用して、特定のタスクにおける AI モデルのパフォーマンスを強化し、より良い出力を生成できます。
データセットが不完全であるか、一部のユースケースを効果的にサポートするには小さすぎる場合があります。複数のツールを試したり、ニーズに合わせてモデルをカスタマイズしたりすると役に立ちます。
倫理とバイアスに関する懸念
AI テクノロジーは魅力的で、多くの可能性を秘めています。ただし、最終的には、コンピュータとアルゴリズムは人間によって構築され、人間が収集したデータに基づいてトレーニングされるため、いくつかの課題に直面します。たとえば、モデルは人間のバイアスと有害な固定観念を学習して増幅し、出力に直接影響する可能性があります。AI テクノロジーの構築にあたっては、バイアスの軽減を優先することが重要です。
AI 生成コンテンツの著作権については、多くの倫理的な考慮事項があります。特に、著作権で保護された素材から大きな影響を受けている場合や、直接コピーされている場合、出力の所有者は誰でしょうか。
新しいコンテンツやアイデアを生成する前に、作成したコンテンツの使用方法に関する既存のポリシーを検討してください。
セキュリティとプライバシー
多くのウェブ デベロッパーは、AI ツールの使用においてプライバシーとセキュリティが最大の懸念事項であると述べています。これは、政府や医療機関など、データ要件が厳しいビジネス コンテキストに特に当てはまります。クラウド API を使用してユーザーデータをより多くのサードパーティに公開することは懸念されます。データ転送は安全に行われ、継続的にモニタリングされることが重要です。
このようなユースケースに対処するには、クライアントサイド AI が鍵となる可能性があります。今後、さらに研究開発を進めていく必要があります。
ウェブ上の AI を使ってみる
さまざまな種類の人工知能について理解できたので、既存のモデルを使用して生産性を高め、優れたウェブサイトとウェブ アプリケーションを構築する方法を検討してみましょう。
AI を使用すると、次のようなことができます。
- サイトの検索の自動入力を改善する。
- スマートカメラで、人やペットなどの一般的な物体の存在を検出する
- 自然言語モデルを使用してコメント スパムを対処します。
- コードの自動補完を有効にして生産性を向上させましょう。
- 次の単語や文の候補を提示する WYSIWYG の文章作成エクスペリエンスを作成します。
- データセットに関するわかりやすい説明を提供します。
- その他...
事前トレーニング済み AI モデルは、最も一般的な AI ツールを支える数学モデルの構築方法や複雑なデータセットの収集方法を完全に理解しなくても、ウェブサイト、ウェブアプリ、生産性を向上させるのに最適な方法です。
ほとんどのモデルは、追加の調整なしですぐにニーズを満たす場合があります。チューニングとは、大規模なデータセットですでにトレーニングされているモデルを取得し、特定の使用ニーズに合わせてさらにトレーニングするプロセスです。モデルをチューニングする方法はいくつかあります。
- 人間からのフィードバックを用いた強化学習(RLHF)は、人間からのフィードバックを使用して、モデルを人間の好みや意図に合わせる手法です。
- Low-Rank Adaptation(LoRA)は、モデルのパフォーマンスを維持しながらトレーニング可能なパラメータの数を減らす、LLM 向けのパラメータ効率の高い方法です。