今さら聞けないAI用語完全ガイド：LLM・RAG・RLHF・ハルシネーションほか30語を解説

記事のサマリー（TL;DR）

AGI・LLM・ハルシネーションなど30語超を、OpenAI・Google DeepMind・Meta の具体例とともに定義
トークン課金・バリデーションロス・RAMageddon など、コスト・インフラに直結するビジネス実務用語を網羅
「コーディングエージェント」「再帰的自己改善（RSI）」など2025年以降の注目概念も収録

国内 AI 導入企業・情シス担当者が押さえるべき実務用語のポイント

AI ツールの導入・調達を検討する日本企業にとって、この用語集が特に重要になる局面は三つある。第一に、トークン（Token）とトークンスループットの理解だ。ChatGPT API や Claude API はトークン単位で課金されるため、業務システムに組み込む際のコスト試算はトークン消費量の見積もりが起点になる。kintone や Salesforce 連携で LLM を呼び出す構成では、プロンプト設計の巧拙がそのまま月次コストに直結する。第二に、**ハルシネーション（Hallucination）**への対策としてのドメイン特化モデルやRAG（Retrieval-Augmented Generation）の採用判断だ。医療・法務・金融など規制業種でのAI活用では「知識のギャップに起因する誤情報生成」のリスクを調達仕様書に明記することが現実的な安全策となる。第三に、RAMageddonが示すサプライチェーンリスクだ。大手AIラボがデータセンター向けRAMを大量購入した結果、コンシューマー向け・エンタープライズ向けのメモリ価格が上昇傾向にあり、オンプレミスGPUサーバーの調達コストにも波及している。クラウド推論（Inference）への移行を検討する際の根拠材料となる。

詳細

AGI（人工汎用知能）

AGI（Artificial General Intelligence）は定義が曖昧な用語だ。一般には「多くのタスクにおいて平均的な人間を超える能力を持つAI」を指す。OpenAI の Sam Altman CEO はかつて「同僚として雇える中央値の人間に相当するもの」と表現し、OpenAI の設立憲章では「ほとんどの経済的に価値ある作業で人間を凌駕する、高度に自律したシステム」と定義している。一方、Google DeepMind は「ほとんどの認知タスクで少なくとも人間と同等に有能なAI」と捉えており、定義は研究機関ごとに異なる。AI 研究の最前線にいる専門家たちの間でも、合意された定義はまだ存在しない。

AI エージェント（AI Agent）

AI エージェントとは、基本的なAIチャットボットを超えた一連のタスクを自律的に実行するツールを指す。経費申請・レストラン予約・コードの作成と保守といった複数ステップの作業を、複数の AI システムを組み合わせながら処理する。ただし、この分野はまだ黎明期であり、「AI エージェント」という言葉の定義は人や文脈によって異なる。インフラ整備も途上にある。

API エンドポイント（API Endpoints）

API エンドポイントは、ソフトウェアの「裏側にあるボタン」と考えると分かりやすい。開発者はこのインターフェースを使って、アプリケーション間でデータを引き出したり、AI エージェントが人間の手を介さずサードパーティサービスを直接制御したりする統合を構築する。AI エージェントの能力が向上するにつれ、これらのエンドポイントを自律的に発見・利用できるようになってきており、自動化の可能性と予期しないリスクの両面が広がっている。

思考の連鎖（Chain of Thought）

人間が複雑な問題を解くために紙に計算式を書くように、大規模言語モデルにおける「思考の連鎖（Chain-of-Thought）推論」とは、問題をより小さな中間ステップに分解して最終的な回答の精度を高める手法だ。回答を得るまでに時間がかかるが、特にロジックやコーディングの文脈では正確性が高まる。推論モデル（Reasoning Models） は従来の LLM を土台に、強化学習によってこの思考の連鎖が最適化されたモデルだ。

コーディングエージェント（Coding Agents）

コーディングエージェントは AI エージェントの一形態で、ソフトウェア開発に特化している。コードを提案するだけでなく、コードの記述・テスト・デバッグを自律的にこなし、コードベース全体を横断してバグを発見し、修正をプッシュする。開発者が日々費やす試行錯誤型の作業を自動化できる。「眠らず集中力を失わない非常に優秀なインターン」と表現されるが、人間によるレビューは依然として不可欠だ。

コンピュート（Compute）

コンピュートとは、AI モデルの学習と推論に必要な計算能力を指す。具体的には GPU・CPU・TPU などのハードウェアが提供する処理能力の総称として使われることが多く、現代 AI 産業の基盤をなす。

ディープラーニング（Deep Learning）

ディープラーニングは機械学習の一分野で、多層の人工ニューラルネットワーク（ANN）構造を持つ AI アルゴリズムを用いる。人間の脳内のニューロン接続から着想を得た構造で、線形モデルや決定木よりも複雑な相関関係を学習できる。データの重要な特徴を人間が定義せずとも自律的に識別し、誤りから学んで出力を改善する仕組みを持つ。ただし良好な結果を得るには大量のデータポイント（数百万件以上）が必要で、学習コストも高い傾向がある。

拡散（Diffusion）

拡散（Diffusion）は、多くの画像・音楽・テキスト生成 AI モデルの中核技術だ。物理学の拡散現象から着想を得ており、写真や音楽などのデータにノイズを徐々に加えて構造を「破壊」し、そこから元データを復元する「逆拡散」プロセスを学習する。Stable Diffusion や DALL-E といった画像生成モデルはこの原理を応用している。

蒸留（Distillation）

蒸留（Distillation）は、大規模な「教師モデル」から知識を抽出して、より小さな「生徒モデル」に移転する技術だ。教師モデルへのリクエストと出力を記録し、その出力を用いて生徒モデルを学習させる。GPT-4 の高速版である GPT-4 Turbo はこの手法で開発されたと考えられている。ただし、競合他社のモデルを無断で蒸留することは、AI API の利用規約違反となるケースがほとんどだ。

ファインチューニング（Fine-tuning）

ファインチューニングは、既存の AI モデルをより特定のタスクや領域に最適化するため、専門化されたデータを用いてさらに学習させる手法だ。多くの AI スタートアップは、大規模言語モデルを出発点として、自社のドメイン知識でファインチューニングを施した商業製品を構築している。

GAN（敵対的生成ネットワーク）

GAN（Generative Adversarial Network）は、二つのニューラルネットワークを競わせることで、リアルなデータを生成する機械学習フレームワークだ。「生成器（Generator）」がデータを生成し、「識別器（Discriminator）」がそれを本物か偽物か判定する。この競争構造がリアルな出力を最適化する。ディープフェイク技術の基盤としても知られるが、特定用途（リアルな写真・動画の生成）に向いており、汎用 AI には適していない。

ハルシネーション（Hallucination）

ハルシネーションは、AI モデルが事実に反する情報を生成してしまう現象を指す業界用語だ。学習データのギャップから生じると考えられており、医療クエリで有害なアドバイスが返るような実害リスクもある。この問題への対策として、知識のギャップと誤情報リスクを低減するためのドメイン特化型・垂直型 AI モデルへの移行が加速している。

推論（Inference）

推論（Inference）は、学習済みの AI モデルを実際に動かし、新しいデータから予測や結論を導き出すプロセスだ。モデルはまず学習（Training）でデータのパターンを習得し、その後の推論で活用する。スマートフォンのプロセッサからクラウドサーバーの高性能 GPU まで多様なハードウェアで実行できるが、大規模モデルはラップトップでは処理に時間がかかりすぎるため、高性能なクラウドインフラが現実的な選択となる。

大規模言語モデル（LLM）

大規模言語モデル（Large Language Model）は、ChatGPT・Claude・Google の Gemini・Meta の Llama・Microsoft Copilot・Mistral の Le Chat など、主要な AI アシスタントが利用しているモデルだ。数十億の数値パラメータ（重み）で構成されるディープニューラルネットワークで、数十億の書籍・記事・トランスクリプトから言語のパターンを学習し、単語と語句の関係性を多次元マップとして表現する。ユーザーがプロンプトを入力すると、モデルはプロンプトに最も適したパターンを生成する。

メモリキャッシュ（Memory Cache）

メモリキャッシュは、推論の効率を高めるための最適化技術だ。特定の計算結果を保存しておくことで、同様のユーザークエリに対する再計算を省く。代表的な手法として KV（Key-Value）キャッシュがあり、Transformer ベースのモデルで使われ、回答生成にかかる時間とアルゴリズムの負荷を削減する。

ニューラルネットワーク（Neural Network）

ニューラルネットワークは、ディープラーニングを支える多層アルゴリズム構造で、生成 AI ブームと大規模言語モデルの隆盛を根底から支える技術だ。人間の脳のニューロン接続を模した設計思想は1940年代まで遡るが、ビデオゲーム産業を通じて普及した GPU の登場が、より多くの層を持つアルゴリズムの学習を可能にし、音声認識・自律走行・創薬など多くの領域でのブレークスルーにつながった。

オープンソース（Open Source）

オープンソースとは、ソフトウェアや AI モデルの基盤コードが公開されており、誰でも自由に利用・検査・改変できることを指す。AI 分野では Meta の Llama ファミリーが代表例で、OS 界では Linux が有名だ。オープンソースは研究・開発の加速と独立した安全監査を可能にする。対してクローズドソース（OpenAI の GPT モデルなど）はコードが非公開で製品のみ使用できる。この対立は AI 業界の主要な論争軸の一つとなっている。

並列化（Parallelization）

並列化（Parallelization）とは、一つの仕事を順番にこなすのではなく、多くの処理を同時並行で実行することだ。プロジェクトを10人で手分けして進めるイメージに近い。AI においては学習と推論の両方に不可欠で、現代の GPU は何千もの計算を同時に実行するよう設計されており、業界のハードウェア基盤となっている。モデルの大規模化にともない、複数チップ・複数マシンへの並列化戦略は独立した研究領域になっている。

RAMageddon（RAMaゲドン）

RAMageddon は、RAM（ランダムアクセスメモリ）チップの深刻な不足を指す新造語だ。大手テック企業と AI ラボがデータセンター向けにRAMを大量購入した結果、供給が逼迫し価格が上昇している。影響はゲーム（コンソール価格の引き上げ）・コンシューマーエレクトロニクス（スマートフォン出荷台数の減少）・エンタープライズコンピューティング（データセンター向けRAM確保困難）に広がっており、不足が解消する見通しは当面立っていない。

再帰的自己改善（Recursive Self-Improvement）

再帰的自己改善（RSI）は、AI モデルが人間の介入なしに自身を改善し始めるシナリオを指す。能力と自律性の急激な加速をもたらす可能性があり、一部の文脈では外部からの介入が不可能になる「シンギュラリティ」に相当する転換点として語られる。一方で「AI モデルは自分の後継機を設計できるか」という工学的な問いとしても捉えられており、近年複数のスタートアップがRSI型モデルの構築に着手しているが、多くは黙示録的な含意を否定し、単なる次の研究フロンティアとして位置付けている。

強化学習（Reinforcement Learning）

強化学習は、システムが行動を試してその成否に対する報酬を受け取ることで学習する手法だ。ペットをご褒美で訓練するのに似ているが、「ペット」はニューラルネットワークで「ご褒美」は成功を示す数学的シグナルだ。固定されたラベル付きデータセットで学習する教師あり学習とは異なり、モデルが環境を探索してフィードバックに基づき行動を更新し続ける。ゲームプレイ・ロボット制御・LLM の推論能力向上に特に効果的で、RLHF（人間のフィードバックによる強化学習） は主要 AI ラボがモデルを有用・正確・安全に調整する中核技術となっている。

トークン（Token）

トークンは、人間と AI のコミュニケーションを橋渡しする基本単位だ。LLM が処理・生成するデータの断片で、テキストを「トークン化」と呼ばれるプロセスで分割することで生成される。コンパイラが人間の言語をバイナリコードに変換するのと似た仕組みだ。エンタープライズ利用においては、ほとんどの AI 企業がトークン単位で LLM の使用料を課金するため、利用量が多いほどコストが増加する。

トークンスループット（Token Throughput）

トークンスループットは、AI システムが一定時間内に処理できるトークン量の指標だ。AI の「仕事量」の測定値に相当し、高いトークンスループットは「同時に何人のユーザーにサービス提供できるか」「各ユーザーがどれだけ速く応答を受け取れるか」を決定するため、AI インフラチームにとって最重要の最適化目標の一つだ。AI 研究者 Andrej Karpathy は「AI サブスクリプションがアイドル状態でいると不安になる」と述べており、スループット最大化への執着を象徴する言葉として引用されている。

学習（Training）

学習（Training）とは、機械学習 AI の開発プロセスの中核で、データをモデルに入力し、パターンを学習させて有用な出力を生成できるようにすることだ。猫の画像認識から俳句の生成まで、目標に向けてシステムを適応させる。大量のデータ入力が必要で、必要量は増加傾向にあるためコストが高くなりがちだ。既存の基盤モデルにターゲットデータでファインチューニングするハイブリッドアプローチは、ゼロから学習するよりもコスト効率が高い。

転移学習（Transfer Learning）

転移学習（Transfer Learning）は、ある目的で学習済みのモデルを出発点として、異なるが関連するタスクの新モデルを開発する技術だ。過去の学習で得た知識を再利用することで開発を効率化できる。学習データが限られているタスクでも有効だが、汎用的な能力を転移学習に依存したモデルは、特定ドメインでの高性能発揮には追加データでの学習が必要になる点に注意が必要だ。

バリデーションロス（Validation Loss）

バリデーションロス（Validation Loss）は、学習中に AI モデルがどれだけうまく学習しているかを示す数値で、低いほど良い。研究者はこれをリアルタイムの成績表として追跡し、学習の停止タイミング・ハイパーパラメータの調整・問題の調査判断に活用する。特に重要なのは「過学習（Overfitting）」の検知だ。過学習とは、モデルが汎用的なパターンを学ぶのではなく学習データを丸暗記してしまう状態で、「本当に内容を理解した学生」と「去年の試験問題を丸暗記した学生」の違いにたとえられる。

重み（Weights）

重み（Weights）は AI 学習の核心で、学習データの各特徴（入力変数）に与える重要度を数値パラメータとして表現したものだ。モデルの出力を左右する。学習開始時は重みがランダムに設定されるが、目標出力に近づくにつれて調整されていく。例えば住宅価格予測モデルでは、寝室・浴室の数、駐車場・ガレージの有無などが入力変数となり、各変数の重みがデータセットに基づいてその物件価値への影響度を反映する形で調整される。