bodais基本アプリに、発展的に移行し、サービス終了しました。2021年7月現在。
アプリ
よくある質問 bodaisプラットフォーム | 株式会社アイズファクトリー |
このエラーメッセージは、アップロードされたモデルファイルの、カテゴリ当たりの正解数が少ない、場合に表示されます。
カテゴリ当たりの正解数が少ない、とはつまり、 ・正解数÷(個人属性列数×各カテゴリ数) が、5より少ないということです。
意味的には、 少ない正解を、多量の変数で予測すると、過学習になってしまう、 ということを表しています。 例えば、下記のようなデータだった場合、
・正解数が100
・個人属性列が10
・各列のカテゴリが4ずつ
100÷(10×4)=2.5
で、カテゴリ当たりの正解数が
・2.5
なので、推奨下限値の5を下回っており、信頼性が低い、となります。
100個の正解を当てるために、40個もカテゴリがあると、多すぎるということです。
計算式を見てわかるとおり、カテゴリあたりの正解数を増やすには、
・正解数を増やす
・個人属性列を減らす
・カテゴリを減らす
の3つの方法があります。
正解数を増やすには、
・業務を進めて正解を増やす
・取り扱う課題(≒正解)の段階を変更する
などが考えられます。
対応しやすいのは、個人属性列を減らす、です。
一番効果の薄そうな(正解の増減に関係なさそうな)個人属性列を削ります。
次に対応しやすいのは、カテゴリを減らす、です。
例えば、47都道府県をそのまま数値化して投入している場合には、
関東地方、関西地方、のようにカテゴリを統合すれば、大幅に減らすことができます。
具体的な解析の手順について、当社データサイエンティストが助言させていただく データ活用カウンセリングサービス もございます。
お問い合わせは、下記ボタンよりお問い合わせください。
世界を革新する挑戦者に、成功を支援する会社
情報通信業