｢Transforme がわかる｣の形 :「翻訳」の学習

例 :「翻訳」の学習

作成: 2025-06-13
更新: 2025-06-13

H^(2) を TV にとってのテクストにする

FFN + 残差接続 + LayerNorm

　　

通常の全結合層を通して情報変換を行い，LayerNormなどで安定化。

(1), (2) をレイヤーの数だけ繰り返す

誤差(得失)計算

誤差逆伝播

　　

トークンベクトル，重み行列 W_Q, W_K, W_V, W_O 等を調整・更新。