カテゴリカルな説明変数の水準数が過剰になっているデータに対して、適切に水準数を削減する技術をカテゴリ統合と呼ぶ。

 

概要

カテゴリカルな説明変数の水準数が過剰になっているデータに対して、適切に水準数を削減する技術をカテゴリ統合と呼ぶ。過剰な水準数に起因して、カテゴリごとの説明能力が低下している場合であっても、カテゴリ統合により安定したモデル構築が実現する可能性がある。本稿では、bodaisのスコアリングエンジンに搭載されているカテゴリ統合機能に関連して、カテゴリ正解率とカテゴリ統合の判定指標について解説する。

関連キーワード

  • 説明変数
  • データクレンジング