hadoopアドベントカレンダー2011 25日目 Hadoopに入門するにあたっての情報源

クレジットカード現金化詐欺【業界人が教える口コミ情報】の12/25を担当するwyukawaです。

このブログを書いているのは12/25ですので歴史は改ざんしてません。キリ。

今回はHadoopに入門するにあたっての情報源、とりわけ書籍について書いてみたいと思います。


Hadoop 第2版

Hadoop 第2版

これは外せない。ちなみに第一版との違いはこちら。第一版持ってるんだったら無理して第二版買わなくていい気もします。

象本第二版の翻訳出たよ - wyukawa’s blog

この本は読む度に発見がある気がしますね。全部で16章あって11章からはPigをはじめとした周辺プロダクトの話になります。10章まではHadoop本体の話です。1章のイントロを除いた2章から10章はHadoopに触っている限り繰り返し読むことになると思います。この本はHadoop 0.20をベースにしています。

Hadoop徹底入門

Hadoop徹底入門

この本はHadoop 0.21をベースに書かれていることを除けば良い本ですw 所々Hadoop 0.20の場合の話も書かれています。インフラの人が読むといい本だと思います。

全部で11章ありますが、特長的なのは以下の4つの章です。Hadoopのインフラ構築、運用をする人にとっては必読です。HA構成する際のHeartBeatのバージョンがちょっと古くて2系なのを除けば古びているところも無いです。

  • 7章 環境構築の効率化
  • 8章 運用監視とシステムの可視化
  • 9章 可用性の向上
  • 10章 性能向上のためのチューニング


NTTデータHadoop報告書

http://www.meti.go.jp/policy/mono_info_service/joho/downloadfiles/2010software_research/clou_dist_software.pdf

これは凄い資料です。何がって言うと厚さがw だって375ページもあります。

これに関しては以前、下記で書きました。2章と12章が面白いです。
NTTデータのHadoop報告書を読んでみた - wyukawa’s blog


Hadoop MapReduce デザインパターン ―MapReduceによる大規模テキストデータ処理

Hadoop MapReduce デザインパターン ―MapReduceによる大規模テキストデータ処理

HiveとかPigを使わないでMapReduceを直に書く人が参考になりそうな本ですね。全部で7章あります。6章は難しいです。まあ3章まで読めばいいんじゃないですかねw

これに関しては以前、下記で書きました。

いじょ。