大規模データを高速に加工/処理するためのノウハウ紹介!

データ解析業務を行う皆さんですと、ギガバイトレベルのデータを扱うような局面が発生すると色々苦労されることも多いと思います。 Hadoopなど分散処理を行ったり、SASなどのツールを用いて加工する方法がありますが、環境構築 … 続きを読む大規模データを高速に加工/処理するためのノウハウ紹介!

scikit-learnによるモデル選択(2)

前回はモデルの正解率をscikit-learnで計算する方法について書きました。 150個体全てのアヤメデータをモデルの訓練に使用し、テストにも同じデータを使ったところ、 K=1のK近傍法では100%の正解率となりました … 続きを読むscikit-learnによるモデル選択(2)

データサイエンティスト 実ビジネス領域最前線

国内のビジネス領域でも、事業活動を活性化するために 様々なデータサイエンティストの方々が活躍されています。 その中でも、リクルート社で活躍されている データサイエンティストの方々の記事をご紹介します。 リクルートテクノロ … 続きを読むデータサイエンティスト 実ビジネス領域最前線

データサイエンスに関するTEDトーク②

バスケットボールの試合における選手一人一人を動く点としてデータを記録し、 機械学習によって選手の複雑な動きを抽出できるようになったという話。 The Math Behind Basketball’s Wild … 続きを読むデータサイエンスに関するTEDトーク②