R TIPSシリーズ⑥ 各種分析とビジュアライズ方法について

R TIPSシリーズ⑥ 各種分析とビジュアライズ方法について

<<前の記事に戻る

 

今回はR Bloggersにて、代表的な分析手法の解説と、それらのビジュアライズ方法についてが整理されたPDFファイルが公開されていますのでそちらのご紹介です。

※ご参考元サイト

http://www.r-bloggers.com/rdatamining-slides-series/

 

 

◆Rでクラスター分析+ビジュアライズ方法について

https://78462f86-a-e2d7344e-s-sites.googlegroups.com/a/rdatamining.com/www/docs/RDataMining-slides-clustering.pdf?attachauth=ANoY7cqWsrZMQPimtBjSEeZHYl_RYp4_pwJk_TZLgnX70aeb0YmddK2P4kuaq8zkAOasMPDFzy-iHJPYI_thD1UMy3riuys99E1dB5vmQ8urNOO-fRqWKRmYwaAzydyptG3VtuBuH81YYIxCxLbCxbuQE-KU3Lom1K7MZk7aOvYFszy6Vh_5ctjbkZ2ojpAxEixF51QVpvHqczKyMZkxhvyj2DziF_l4J1jJRAC3YRYOQPK3A2MSJlM%3D&attredirects=0

代表的な非階層クラスタリング手法であるK-means法や、K-Medoids法(K-means法と類似、距離の考え方が異なる)の違いなども説明があり、

また、Density-based Clusteringについてはクラスタリングだけではなく、一度分類したモデルを用いて新たなデータを分割(予測)する方法についても示されています。

 

 

◆Rでアソシエーション分析+ビジュアライズ方法について

https://78462f86-a-e2d7344e-s-sites.googlegroups.com/a/rdatamining.com/www/docs/RDataMining-slides-association-rules.pdf?attachauth=ANoY7cogtTceAJIIRKErBfsImiit3gi2DvqVIgwYRQqJ_v4_CkXII2IroUlt8wVz3C6GNAQ-RY96Eix5NFLI9NFy33Q5rIJiJ5DL0j-HY9Ky1NCtXspMDLMAnxnKlgl7GefpOoZW2BwaX_NvNp126vOixTYemRa9kZJW1HZZLgjNHjs1dNcNPyj6SBYVg20YbUn7YWaKr90fGOAesz1pZ8Uw8TIxHyk2dZbVFsbNceZopH5oHNQ5Q0ZQ6W_8Lb6XgiCSLeZA4MyN&attredirects=0

アソシエーション分析による併用パターンの抽出から、それらルールのビジュアル化について色々な方法が紹介されています。

沢山のルールが抽出された際、確信度やサポートなどの指標を元にポジショニングを行うなど、実案件でのアウトプットの見せ方にも応用できると思います。

 

 

◆Rでテキストマイニング(ただし英語)+ビジュアライズ方法について

https://78462f86-a-e2d7344e-s-sites.googlegroups.com/a/rdatamining.com/www/docs/RDataMining-slides-text-mining.pdf?attachauth=ANoY7crxhmm8ZgpJ0pV3T0TKD0a9SrttcxzsSeeB2KbP54fns8DWMFOy9vmSQGhc9-WCX2ccrdPv1oGFPcgMSVC04AFDNqUeD5oKw2IeUpQm_V2DfzxTumWTGpSmkKEQ1dpqdx8_zAZ7fhJw5LDCjjTlDqIzL-_JpfK3w4Uv2OgBaAU6_bc8r0OGrEgED-6e9b5RvbTuoEFrk_6ziZeOEBKy3DSGzPxyOQAt2S4pdmVDFXwWUIHyg7M%3D&attredirects=0

英語の文章がサンプルですが、形態素解析結果についてランキングを行ったり、ワードクラウドという手法を用いて見せ方を工夫する方法が紹介されています。

特にTwitterデータを用いたトピックモデルの実例などは、実際のマーケティング分析においても非常に有効なアプローチです。

 

 

◆Rで時系列分析とビジュアライズ方法について

https://78462f86-a-e2d7344e-s-sites.googlegroups.com/a/rdatamining.com/www/docs/RDataMining-slides-time-series-analysis.pdf?attachauth=ANoY7crGTtQxdFTS8lnhWFVPh7sKuVlEs9sOOspHaCLE7_vVTUkAvddC8Qwx1i9tqb4aw9Jc6qIA_NRXYqPUOdVXx1bGLd1hcvM91h_rMs0xfqEqe1YoVl1vShAsBWDZzmIiu83JPtCfdTXDqRh_92qbw5nNvQ2lL-dm9sXDeutAzg1wBtvJRvsEtbLLtCIs9fQZD1sO9x7szYQ_OpMVmSzmmaSIbFT7AraBN6RTeFRe-ga-c3Pdx8S4_WfV34rCXKAgYQdXt-wG&attredirects=0

ARIMAモデルを用いた時系列データの分解や予測についてのTIPSや、時系列データ同士の距離算出~クラスタリングについて一通りの流れがまとまっています。

 

続きを読む>>