｢Transforme がわかる｣の形 : ｢応答｣の学習

例 : ｢応答｣の学習

作成: 2025-06-13
更新: 2025-06-13

入力文 (質問) :	｢日本の軍事力を具体的数値を用いてある程度詳しく教えて」
出力文 (応答) :	｢日本の自衛隊は ‥‥ 」

H^(2) を TV にとってのテクストにする

FFN + 残差接続 + LayerNorm

通常の全結合層を通して情報変換を行い，LayerNormなどで安定化。

(1), (2) をレイヤーの数だけ繰り返す

誤差(得失)計算

誤差逆伝播

トークンベクトル，重み行列 W_Q, W_K, W_V, W_O 等を調整・更新。