「ChatGPT がわかる」への道 : 応答生成 : アルゴリズム

応答生成アルゴリズム

作成: 2023-06-16
更新: 2025-06-18

入力系列 (プロンプト) : [ x_1, ‥‥, x_m ]
　　↓
Transformer で処理 → 出力ベクトル列 [ z_1, ‥‥, z_m ]
　　↓
z_m から softmax → 次トークン y_1 をサンプリング
　　↓
系列に追加して再帰的に入力: [ x_1, ‥‥, x_m, y_1 ]
　　↓
再び Transformer へ入力 → 次のトークン y_2 生成
　　↓
　……　(この繰り返し)

Step 1：初期化（プロンプト入力）

Step 2：Transformerで出力ベクトルを得る

Step 3：語彙分布を計算

最後の位置 z_m に線形層（LM Head) + softmax を適用

語彙全体への確率分布：
　　　P( s_j | x_1, ..., x_m ) = softmax(logits)

Step 4：次のトークンを選択

温度・トップp・トップk 等の生成戦略（decoding strategy) を用いて
次のトークン y_1 を選択（または確率的にサンプリング）

Step 5：y_1 を系列に追加し、再帰処理

「外部のサンプリング戦略（decoding algorithm）」とは？

全体の流れ（応答生成時）

### Step 2. Transformer（TV）が出力分布を返す

Transformerの出力は、以下のような確率分布（softmax後）：

　　　P( s_j | x_1, ..., x_m ) = softmax(logits)

トークン候補	確率
s_1「私は」	0.55
s_2「AI」	0.20
s_3「ChatGPT」	0.15
s_4「人間」	0.05
s_5「GPT」	0.05

代表的な Decoding 戦略

1. Greedy decoding（貪欲法）

2. Sampling（単純サンプリング）

3. Top-k Sampling

4. Top-p Sampling（nucleus sampling）

5. Beam Search（ビーム探索）