情報工学科の大学生が学ぶこと

今学んでいることが何に結びつくのかを理解し、効率的に実践的な知識を身につける術を提供します。

【自然言語処理】交差検定とは

前提

モデルなどの学習に用いる訓練データに対し、実際にうまく分類できるかなどの評価に用いる評価データ(test data)とよぶ。

手順

  1. まずはデータをn分割する
  2. 一つ目のデータセットを評価データとして扱い、残りのn-1個のデータセットを訓練データとして用いる
  3. 2の手順を、n個まで繰り返す
  4. n個の評価指標値(RecallやPrecisionなど)が得られるので、その平均を最終的な評価指標とする