クラスタ分析とは、様々な性質を有したデータの集合から、類似性を持った複数の小集団(クラスタ)に分類分けを行う手法である。

 

概要

クラスタ分析とは、様々な性質を有したデータの集合から、類似性を持った複数の小集団(クラスタ)に分類分けを行う手法である。
この手法を様々な顧客情報(年代・性別・職業など)を含むアンケート結果等に適用すると、クラスタごとに特徴を見出すことができる。
例えば、あるクラスタに「20 代」「女性」「既婚」という属性を持つサンプル(顧客)が多く集まっていれば、そのクラスタは、「若い主婦層」といった特徴づけが 可能となる。このようなサンプル間の類似性をデータ間の距離や相関係数として定量化し、分散など所定の統 計的基準を用いて分類計算を行うのがクラスタ分析である。 本レポートでは、クラスタ分析の代表的手法とその用途について説明する。

関連キーワード

  • クラスタ分析
  • 階層的クラスタリング
  • 非階層的クラスタリング
  • デンドログラム
  • k-平均法