ビッグデータという5年ぐらい前に流行った言葉が最近この業界で流行っているので、なんだかなーと思いつつ昔買った本を読み直してみた。
- 3Vに照らし合わせて、ビッグデータと呼んでもいいねと思える生命科学関連データって実際どんなものがあるのだろうか?
- データが増えることで、新たな知識の発見に繋がる可能性のあるビッグデータはどのVなのだろうか?
- pubmedのような自然言語のデータはビッグデータと呼ぶのだろうか?
Wikipediaによると
ビッグデータ [1][2](英: big data)とは、市販されているデータベース管理ツールや従来のデータ処理アプリケーションで処理することが困難なほど巨大で複雑なデータ集合の集積物を表す用語である。
と定義されているのに、publicなデータベースをビッグデータって呼んでみたり、ビッグデータDBとか言っちゃうのはなんだかなーと思うんだよねー
言葉の乱れはサイエンスの乱れというかきちんと理解していない証拠なんだろうけど。
特に新規疾患ターゲット探索で使う手法って僕がゲノム創薬とかいう名目でバイオインフォマティクスやってた頃に比べて、すごく目新しい手法ってあんまり出てない気がするんだけどそういうわけじゃないのかな?っていうあたりが知りたいんですよね。バイオインフォマティクスとかテキストマイニングとか。
もし土曜日に会う人で、「 俺がレクチャーしちゃる 」っていう方がいたらよろしくお願いします。