RでTwitterデータをクローリングするために

データサイエンスにおけるインプットデータについて、大きくはPOSデータのような数値型/定型データと、 SNSでのクチコミのような文章型/非定型データに分類できます。   特に後者の文章型/非定型データについては … 続きを読むRでTwitterデータをクローリングするために

膨大なWebの世界からデータを収集する技術、クローリング&スクレイピング

データ分析を行う上で(当たり前のお話ですが)インプットとなるデータは非常に大事です。 一方で、 ・分析したくてもデータがない! ・アンケート調査はコストがかかる! ・いちいちデータを手で入力するのは面倒だ! ・・・など、 … 続きを読む膨大なWebの世界からデータを収集する技術、クローリング&スクレイピング