Heritage Health Prizeについて(1)

Heritage Health Prizeについて(1)

今回は、データ分析コンペのプラットフォームであるKaggleにおいて、賞金総額300万ドル、コンペ期間2年間という過去最大の規模で行われたHeritage Health Prizeについて紹介したいと思います。

Kaggleとは? 

Kaggleは、企業のデータを世界中の様々な専門分野の人が分析して最適モデルを競い合うコンペのプラットフォームを運営する会社です。2015年9月時点で36万8000人がKaggleに登録しています。

参加者はコンペでの成績をもとにスコアリングされてUser Rankingのページに掲示されるため、高スコアのデータサイエンティストをリクルートする目的でKaggleのサイトを利用する企業もあります。また、ホームページ上のフォーラムには新しいアルゴリズムや分析手法が投稿され、最先端の知識を学ぶ場としても多くの人に活用されています。

Heritage Health Prize 

今回紹介するコンペ、Heritage Health Prizeは、医療機関における請求書データから、各患者の入院日数を予測するものです。

American Hospital Associationの報告によると、アメリカでは毎年7100万人以上が病院に行き、2006年には300億ドル以上の不要な入院費用が発生しています。こうした費用を抑えるために入院リスクの高い患者をあらかじめ特定し、必要な処置を事前に施そうというのがこのコンペ目的です。

コンペは2011年4月4日から2013年4月4日までの2年間にわたって行われました。2年間の間に3度、マイルストーン賞という途中経過で選ばれる賞があり、各時点での1位と2位には総額23万ドルの賞金が支払われました。そして2013年4月4日時点で、スポンサーが設定した予測精度の基準を上回り、かつ、最も良いスコアを出したチームには300万ドルの賞金が設定されました。この金額は現在までのKaggleにおいて最高額で、Heritage Health PrizeはKaggleの名を一躍有名にしたコンペです。

実際に予測精度の基準を上回るチームは現れなかったものの、優勝した”POWERDOT”チームには敢闘賞として50万ドルが贈られました。

優勝チーム

第3回マイルストーン賞では、MestromとGrijsという二人のオランダ人が一位を獲得しています。第1回マイルストーン賞でMestromは2位、第2回マイルストーン賞でもMestromとGrijsのチームで2位を獲得しています。最終的な優勝チームはマイルストーン賞の受賞者やLeaderboard上位者のオールスターチームのようになっていて、この二人も優勝メンバに名を連ねています。

Mestromはオランダでインターネット情報を収集・配信する会社に勤めており、毎晩家に帰って二人の小さな子供を寝かしつけた後、30分から1時間ほどの時間を使ってこのコンペのためのアルゴリズムに取り組んでいたそうです。Grijesはオランダの民間企業に勤めるソフトウェアエンジニアです。 

大規模なコンペの上位チームでは研究者のような人が相当な時間をつぎ込んでいると想像していたので、普通の会社員が仕事終わりの時間を使って優勝したというのは意外でした。

参考ホームページ

[1]Kaggleホームページ  https://www.kaggle.com/ 

[2]Heritage Health Prize コンペティション公式ページ  http://www.heritagehealthprize.com/c/hhp

 

続きを読む>>