Up | 位置エンコーディング (事前計算) | 作成: 2025-05-16 更新: 2025-05-26 |
・入力テクストS のトークン数を LEN(S) で表す。 整数 i, j に対し,pos_ij をつぎのように定義する: j が奇数のとき:pos_ij = cos( i / 10000^((j-1)/D) ) L × D 行列の ( pos_ij ) を POS(L) と表す。 「POS(L)」は,つぎのように読める:
pos_ij は定数なので,POS は事前計算される。 入力層では,入力テクスト S の I 番目のトークンに対応するトークンベクトルに,pos_i が加算される。 <これには,「トークンベクトルに文脈の順序情報を注入」の意味が見込まれている。 |