初学者視点で大手LLMの裏側の仕組みを「電車」に例えてみた
はじめに
最近、大規模なLLMの裏側がどのような仕組みで動いているのかを学ぶ機会がありました。
技術的な用語が多くて難しく感じられがちですが、「電車」に例えてみると非常にすっきりと理解できたので、初学者視点のアウトプットとして共有します。少しでも参考になれば幸いです。
LLMの裏側を動かす「5つの要素」と電車の例え
大規模LLMのシステムは、大きく分けて5つの要素で構成されています。これらを「電車」に例えて整理してみましょう。
1. システムプロンプト = 「電車の運行規則」
AI全体に対して、あらかじめ設定されている最優先のルールです。
電車でいう「最高時速の制限」「各駅停車や急行の割り振り」「優先席の設置基準」のように、システムが安全かつ正確に動くための絶対的な土台にあたります。
2. カスタム指示 = 「車内のマナー」
利用者がAIに対して、事前に登録しておく好みの挙動や共通ルールのことです。
電車でいう「大声で話さない」「大音量で音楽を聴かない」「お年寄りに席を譲る」といった、乗客が快適に過ごすためのマナーや振る舞い方に似ています。
3. コンテキストウィンドウ = 「満員電車」
AIが一度に記憶・処理できる情報の容量(トークン数)の上限を指します。
まさに「満員電車」と同じです。乗車できる人数には上限があり、限界を超えて新しい乗客が入ってくると、古い乗客(過去の会話データ)が押し出されて電車の外へ出ていってしまいます。AIが長文の会話で昔の内容を忘れてしまうのは、このためです。
4. プロンプト = 「乗客」
利用者がAIに入力する質問や命令文のことです。
電車に乗り込んでくる「乗客」そのものです。どのような乗客が乗ってくるかによって、車内の状況や目的地(出力結果)が変わります。
5. ガードレール = 「緊急停止ボタン」
AIが悪質な質問や不適切な出力をしないように、制御をかける安全装置です。
問題が発生したときや危険を察知したときに発動する「電車の緊急停止ボタン」の役割を果たします。
重要な情報はどこにある?AIと電車の共通点
電車の車掌室は、一般的に「先頭」と「最後尾」の両端にあり、電車の安全運行をコントロールする心臓部となっています。
実は、大規模LLMもこれと非常によく似た性質を持っています。AIは長い文章を処理する際、「最初の文脈(先頭)」と「最後の文脈(最後尾)」の内容を特に重視する傾向があります。どれだけ賢いAIであっても、文章の「真ん中」にある情報は忘れられやすいという弱点があります。これを「Lost in the Middle」と呼びます。
指示を与えるときは、重要なルールを最初か最後に配置すると、AIが正しく認識しやすくなります。
まとめ
一見難しそうな大規模AIの仕組みも、身近な「電車」に置き換えることで、それぞれの役割がイメージしやすくなります。
- 運行規則とマナーで全体の行動を縛る
- 満員電車の容量の中で**乗客(質問)**を処理する
- 危険があれば緊急停止ボタンが作動する
- 電車と同様に**先頭と最後尾(最初と最後の文脈)**が重要
この構造を頭の片隅に置いておくと、AIに指示を出すとき(プロンプト作成時)にも「どこに何を工夫すればよいか」が見えてくるようになります。