R TIPSシリーズ⑤ クラスタリング方法を色々考えてみる

R TIPSシリーズ⑤ クラスタリング方法を色々考えてみる

<<前の記事に戻る

 

クラスタリングの手法は階層型クラスター分析、K-means法をはじめ、色々な手法が活用されています。

予測モデルのように明確な正解(≒教師データ)がない手法であるため、どの手法を用いて分析を行うかは、分析者の好みやセンス、また

どれだけ色々な分類手法を把握しているか・・に依存すると思います。

 

クラスタリングを考える上で、先ずは距離と分類というスライドで非常に分かりやすい資料をご紹介します。

ここのスライドで紹介されているように、クラスター分析については

階層的/非階層的/空間的 という3つのクラスタ同士の関係性と、

ソフト/ハード という、1つのデータが複数のクラスターに所属することを許すかどうか・・というポイントがあります。

 

その上で、改めてRで実行できるクラスター分析について確認しましょう。

 

■階層型クラスター分析

https://www1.doshisha.ac.jp/~mjin/R/28/28.html

 

■非階層型クラスター分析

K-means法

http://d.hatena.ne.jp/hamadakoichi/20100415/p1

 

X-,means法

最適なクラスタ数を推定するK-means法を拡張させた手法

http://d.hatena.ne.jp/kaiseh/20090628/1246223266

http://www.seto.nanzan-u.ac.jp/st/nas/academia/vol_011pdf/11-017-034.pdf

 

C-means法

ファジィ・クラスタリング手法で複数のクラスタに所属させる

http://blog.goo.ne.jp/xmldtp/e/2b3658e128d860a53e9115b3ffde4166

 

Kohonen

自己組織化マップにより空間的にクラスタリングを行う手法

https://www1.doshisha.ac.jp/~mjin/R/30/30.html

 

 

■モデルベースクラスター分析

混合分布モデル、潜在クラス分析など、元のデータは複数の分布が重なっていると仮定した確率モデルによる分類手法

http://d.hatena.ne.jp/EulerDijkstra/20130618/1371552902

http://blog.kzfmix.com/entry/1226489665

 

R

 

続きを読む>>