商品別のよくある質問と回答です。以下に無い質問については各商品ページ内のお問合せからご質問ください

 
bodaisプラットフォーム

アプリ

  • 株式会社アイズファクトリー
よくある質問 bodaisプラットフォーム 株式会社アイズファクトリー
 

エラー/アラート(スコアリング):カテゴリあたりの正解数が少ない・・・

カテゴリあたりの正解数が少ないため、モデルの信頼度が低い可能性があります。
カテゴリあたりの平均正解数: XXXX
(5以上が推奨されます)

エラー/アラート(スコアリング):カテゴリあたりの正解数が少ない・・・

このエラーメッセージは、アップロードされたモデルファイルの、カテゴリ当たりの正解数が少ない、場合に表示されます。
カテゴリ当たりの正解数が少ない、とはつまり、 ・正解数÷(個人属性列数×各カテゴリ数) が、5より少ないということです。
意味的には、 少ない正解を、多量の変数で予測すると、過学習になってしまう、 ということを表しています。 例えば、下記のようなデータだった場合、

・正解数が100
・個人属性列が10
・各列のカテゴリが4ずつ

100÷(10×4)=2.5
で、カテゴリ当たりの正解数が
・2.5

なので、推奨下限値の5を下回っており、信頼性が低い、となります。
100個の正解を当てるために、40個もカテゴリがあると、多すぎるということです。
計算式を見てわかるとおり、カテゴリあたりの正解数を増やすには、

・正解数を増やす
・個人属性列を減らす
・カテゴリを減らす
の3つの方法があります。

正解数を増やすには、
・業務を進めて正解を増やす
・取り扱う課題(≒正解)の段階を変更する
などが考えられます。

対応しやすいのは、個人属性列を減らす、です。
一番効果の薄そうな(正解の増減に関係なさそうな)個人属性列を削ります。
次に対応しやすいのは、カテゴリを減らす、です。
例えば、47都道府県をそのまま数値化して投入している場合には、
関東地方、関西地方、のようにカテゴリを統合すれば、大幅に減らすことができます。

具体的な解析の手順について、当社データサイエンティストが助言させていただく データ活用カウンセリングサービス もございます。