Rで超簡単、超便利なBIツール作成!

Rで超簡単、超便利なBIツール作成!

現在、TableauやQlikView、PentahoといったBIツールが普及しており、
データ分析業務の一環で、OLAPによるインタラクティブなデータ集計
作業なども行われることが多くなっています。

※OLAPはonline analytical processingの略であり、
複雑で分析的な問い合わせに素早く回答を行う方法の事である。

そんな中、無料の統計解析ツールであるRで
超簡単にOLAP分析が出来ることをご存知でしょうか?

ソースコードと画面イメージを元に、具体的な
方法をご紹介します。

①まずライブラリのインストール、呼び出しを行う。

install.packages(“rpivotTable”)
library(“rpivotTable”)

②分析したいデータを指定。ここではRのサンプルデータである
タイタニック号の生存有無データを活用します。

input_data<-data.frame(Titanic)

#input_data<-data.frame(iris) ←別のデータを指定することも可能

③次に以下の命令を実行することでブラウザが起動し、
インタラクティブなOLAP分析が可能となります。

rpivotTable(input_data, rows = colnames(input_data[1]), cols = colnames(input_data[2]), width = “100%”, height = “400px”)

 

④では、実際に立ち上がった画面で、いくつか操作イメージを確認しましょう。

 

・ブラウザが立ち上がると、Excelのピボットテーブルのような画面が出てきます。

縦軸/横軸に項目をドラッグ&ドロップすることで、任意の切り口でクロス集計表が作成できます。

1

 

・例えば、縦軸に”Class”、横軸に”Sex”、”Age”、”Survived”を設定します。

また、右上部分で”Freq”の合計(Sum)を指定することで、実際の客数合計が集計されます。

これにより、”Class”(客室ランク)毎に、どんな属性の乗客が生存したか、しなかったか

分かります。

 

 

 

2

→一等客室の乗客で特に女性は、助かっていた(Survived=Yes)人数割合が多いようですね。

 

・画面上の一番左上のプルダウンを選択することで、テーブル形式以外にも

様々な見せ方が出来ます。

3

 

・例えば”Heatmap”を選択すると、数値の大きさに合わせて色分けがされます。

4

 

・他にも折れ線グラフで生存者数/死亡者数の比較を確認することが出来ます。

5

 

・特に三等客室の男性や乗組員男性は死亡者数のグラフが大きいことが確認できますね。

6

 

みなさんも、実際に色々なデータを投入して分析してみてください!Enjoy!