R と Python はじめるならどっち!?

R と Python はじめるならどっち!?

データサイエンティストがデータ解析に用いる解析ツールとしては
SASやIBM SPSS(Modeler)が商用ソフトウェアとして有名ですが、
フリーのツールとして”R”(アール)と”Python”(パイソン)の2つが挙げられます。

では、無料でデータ解析を始めるために
“R”と”Python”どちらを使うべきでしょうか?

R派の意見

Rは書籍やサイト上でも色々な記事が多いため、
入門者から本格的な解析まで、参考情報が多いのがメリットです。

ここでの意見として
・データ解析を行う上で不便さを感じたことはない
・探索的データ解析がやりやすい機能が備わっている
・dplyr/tidyrとggplot2というライブラリがなければ
 “Python”に移っていたかも

という風に、データサイエンティストが解析を行う上では
必要十分な機能が備わっている一方、
いくつか便利なライブラリに依存している傾向が見られます。

トレンドは”R”から”Python”に

一方で、データサイエンスのプログラム言語は”R”から
“Python”に置き換わるという意見もあります。

ここでの意見として
・”R”は厳密にはプログラム言語ではない
・ウェブサイトのスクリプティングなどをはじめとして
様々なアプリケーションでの使い方がある
・”R”よりもアプローチのしやすさと汎用性の高さがある

と、汎用性の高さや今後の普及可能性が期待されています。

RとPython の実務レベルの素養をつけたい方はデータサイエンスアカデミーへ!

具体的なコーディング方法の比較

では最後に、実際にそれぞれのコーディング比較をして
具体的な解析の違いを比較した有益なサイトをご紹介します。

ここでも結論で語られているように
“”R”はより関数的で、”Python”はよりオブジェクト指向である”
“”R”はより多くのデータ分析がビルトインされており、”Python”はパッケージに依存している”
“統計以外のタスクを行う場合は、”Python”の方が単純である”
という評価結果となっています。

いずれにせよ、両言語のデータ解析のワークフローには
多くの類似性があるという指摘もあるように
それぞれの特性を活かして、両方のツールを有効活用することが
望ましいと考えられます。

その他の参考: