Up 「応答」学習のゴール [ p_1, ‥‥, p_m ] 作成: 2025-06-25
更新: 2025-06-25


    「応答」学習のゴールは,[ p_1, ‥‥, p_m ] がつぎのようになることである:
      質問テクストのトークン点列
          [ x_1, ‥‥, x_m ]
      に対し,
        [ x_1, ‥‥, x_m ]
          → [ p_1, ‥‥, p_m ]
          → x_m のつぎのトークン点 y_1
        [ x_1, ‥‥, x_m, y_1 ]
          → [ p_1, ‥‥, p_m, p_(m+1) ]
          → y_1 のつぎのトークン点 y_2
         :
      と生成したときの
          [ y_1, y_2, ‥‥ ]
      は,良質な応答テクストのトークン点列になっている。