第1回 Vertica 勉強会に行ってきた
発表者、スタッフのみなさんお疲れ様でした。ありがとうございました。
DeNAの勉強会は素晴らしいですね。DeNA水出るし、寿司出るし、無線LAN使えるしで至れり尽くせりです。
当日の雰囲気は第1回 Vertica 勉強会 - Togetterを見ればなんとなく伝わるんじゃないでしょうか。
僕はVertica使ってないし将来もたぶん使わなそうですが、参考になりました。
この分野はNetezza(PureData), Teradata, Oracle Exadataといったハードウェア一体型のものが市場を取っている感じがしますが、Verticaのようなソフトウェア型の方が試しやすいですよね。ただまあTwitter見てるとインストールが大変そうではありましたが。
カラム型DBなのはこの分野では普通だと思うんですけど、マスターが無いというのは特徴的ですね。
DeNAの方の発表はすごく現場よりでとても良かったと思います。そしてVerticaの運用大変そうだというのも伝わってきましたw ただこれはDeNAのようにアナリストが多数いてガンガンクエリが流れる環境ならではという側面もあると思います。
DeNAの環境に関しては何故DeNAがverticaを選んだか?も参考になります。
Verticaのような高速なストレージは分析環境に必要なケースはあるんですが、商用で高いので容量に限界があります。なのでHadoopとの平行運用という形になると思うんですけど、ストレージが複数あるとデータの出し入れもあるし運用負荷はどうしても上がる。Prestoはその辺、楽です。ストレージの種類増えないし、面倒なことはHadoop側に任せていることもあり、セットアップ楽だし、運用も楽。ただしさすがに性能はVerticaのようなDWH製品には劣ると思うので、必要なところには入ってくるでしょうね。
RedshiftやBigQueryのようなクラウド環境を使う場合でも一癖二癖あるようなので、オンプレじゃなくてクラウド使えば解決という感じでも無さそう。オンプレの方が開発者側でコントロール出来るというメリットもあります。あと大企業だと価格的にオンプレのほうが安いということもありそう。
まあ、いろんな選択肢考えていきたいですね。