新たなデータベース技術:グラフデータベースについて

新たなデータベース技術:グラフデータベースについて

通常、データ分析で用いるデータベース(以降DB)と言えば、Relational Database(RDB)と呼ばれる一般的な方式のものですが、ここ最近はグラフデータベースという名前が聞かれるようになりました。

グラフデータベースとは、「ノード」「リレーション」「プロパティ」の3要素によってノード間の「関係性」を表現する「グラフ型のデータモデル」を持つデータベースといえます。

分かりやすいイメージでいえば、ソーシャルネットワーク上の友達関係をデータとして表現する際に適している形式です。

 

具体的な活用例などは、こちらのページで詳しく解説されていますが

http://www.atmarkit.co.jp/ait/articles/1507/28/news015.html

・ユーザー同士のつながり関係から友達の友達を探す

・通信ネットワークや電力のグリッド網の管理

・路線図や地図上で最適ルートを探す

など、複雑なつながり関係の中から最短経路を見つけたり、何らかの障害が起きた時にどのルートを遮断すれば被害が最小限になるか・・といった問題解決ができるようです。

 

 

また、グラフデータベースの中でもNeo4jが有名です。

http://www.creationline.com/neo4j

 

こちらのページではNeo4jの特徴が分かりやすく説明されていますが、特に他のデータベースとの比較表が分かりやすいと思います。

ここでは、カラム指向データベースやキーバリューデータベースといったキーワードが出ていますが、これらはいずれもNoSQLデータベースと呼ばれるものです。

 

NoSQLデータベースの説明については

http://www.ctc-g.co.jp/report/column/it_nosqldb/

CTC社のサイトで詳しく説明されていますので、参考になると思います。

 

今後、データの多様化/複雑化に対応した新たなデータベース形式/技術がどんどん登場すると思われます。

是非、こういったデータベースも活用しながら、効率的で効果的なデータ分析が出来ればよいですね。