博士号取得者がビジネスマンになるいくつかの方法の1つとしての、データサイエンス専門家という道(その6)

博士号取得者がビジネスマンになるいくつかの方法の1つとしての、データサイエンス専門家という道(その6)

<<前の記事に戻る

 

生物物理という分野でPh.Dをとった非データサイエンス系サイエンティストの私は、データサイエンス専門家になるために、1年目は多くの事を自分の頭にインプットしました。それは大きく「IT系のスキル」、「データサイエンスのスキル」、「ビジネスのスキル」に分類できます。前回の記事までで、「IT系のスキル」として何を勉強したのかを述べてきました。今回は「データサイエンスのスキル」について書きたいと思います。

データサイエンスという分野は広範にわたります。ですから、いきなり全てを身に付けるのは困難なのですね。じゃあ、とりあえず仕事をするために何を覚えとくと良い?って話になると思うんですが、私は以下だと考えております。  

1.回帰分析(線形回帰、ロジスティック回帰)

2.主成分分析・因子分析  

3.クラスター分析(階層型・非階層型)

4.決定木

5.アソシエーション分析

6.テキストマイニング

これらから始めると、(精度の良し悪しは置いておいて)概ねデータサイエンスでできる事が何か見えてきます。そこから先は自分で気になったものを学ぶことになります。 上記ってこの分野においては比較的古典的な事柄なのです。それだけに教科書もたくさんあります。インターネットを調べるとたくさん資料が出てきます。そして R が使えるようになっていると、実際に統計処理を動かして体験する事ができます。そんなわけで私は以下のステップで勉強を行いました。  

ステップ1.インターネットで手法の概要を把握する  

ステップ2.R をつかって実際に統計処理を行ってみる  

ステップ3.教科書を読んで深く理解する

ステップ1と2を同時実行できる素晴らしいサイトがあります。以下です。これは素晴らしい。絶対にお薦めです。 Welcome to Mingzhe Jin’s Home Page

ステップ3の教科書としては、以下あたりを学びました。「パターン認識と機械学習」はかなり歯ごたえがある本なので、1年目以降も少しずつ学びました。

・入門はじめての統計解析 ・入門はじめての多変量解析 ・パターン認識と機械学習 上 ・パターン認識と機械学習 下 発展し続けている分野でもあり、常に新しい手法が生まれています。ですから、インターネットからの情報収集も行っていました。私の1年目の頃は自分でRSSリーダーにRSSを登録して記事を集めるのが主流だったのですが、現在だと、例えばカメリオってアプリで簡単に関連記事を集める事も可能です。 

カメリオ https://web.kamel.io/ Androidアプリ、iPhoneアプリも用意されています。

気になるキーワードを入れると、それに関連する記事を集めてきてくれる…というサービスです。ここに「データサイエンス」「データマイニング」「統計解析」「人工知能」…などのキーワードを入れておけば、トレンドを追う事が可能です。気になる手法やツールが現れたら、上記のステップ1→ステップ2→ステップ3で自分のスキルにしてしまいます。 以上が私の「データサイエンスのスキル」の学び方です。次回は「ビジネスのスキル」の学び方、および、この長く続いたシリーズの総括をしたいと思います。

 

続きを読む>>