hadoopアドベントカレンダー2011 25日目 Hadoopに入門するにあたっての情報源
クレジットカード現金化詐欺【業界人が教える口コミ情報】の12/25を担当するwyukawaです。
このブログを書いているのは12/25ですので歴史は改ざんしてません。キリ。
今回はHadoopに入門するにあたっての情報源、とりわけ書籍について書いてみたいと思います。
- 作者: Tom White,玉川竜司,兼田聖士
- 出版社/メーカー: オライリージャパン
- 発売日: 2011/07/23
- メディア: 大型本
- 購入: 9人 クリック: 182回
- この商品を含むブログ (24件) を見る
これは外せない。ちなみに第一版との違いはこちら。第一版持ってるんだったら無理して第二版買わなくていい気もします。
この本は読む度に発見がある気がしますね。全部で16章あって11章からはPigをはじめとした周辺プロダクトの話になります。10章まではHadoop本体の話です。1章のイントロを除いた2章から10章はHadoopに触っている限り繰り返し読むことになると思います。この本はHadoop 0.20をベースにしています。
- 作者: 太田一樹,下垣徹,山下真一,猿田浩輔,藤井達朗,濱野賢一朗
- 出版社/メーカー: 翔泳社
- 発売日: 2011/01/28
- メディア: 大型本
- 購入: 14人 クリック: 668回
- この商品を含むブログ (43件) を見る
この本はHadoop 0.21をベースに書かれていることを除けば良い本ですw 所々Hadoop 0.20の場合の話も書かれています。インフラの人が読むといい本だと思います。
全部で11章ありますが、特長的なのは以下の4つの章です。Hadoopのインフラ構築、運用をする人にとっては必読です。HA構成する際のHeartBeatのバージョンがちょっと古くて2系なのを除けば古びているところも無いです。
- 7章 環境構築の効率化
- 8章 運用監視とシステムの可視化
- 9章 可用性の向上
- 10章 性能向上のためのチューニング
これは凄い資料です。何がって言うと厚さがw だって375ページもあります。
これに関しては以前、下記で書きました。2章と12章が面白いです。
NTTデータのHadoop報告書を読んでみた - wyukawa’s blog
Hadoop MapReduce デザインパターン ―MapReduceによる大規模テキストデータ処理
- 作者: Jimmy Lin,Chris Dyer,神林飛志,野村直之,玉川竜司
- 出版社/メーカー: オライリージャパン
- 発売日: 2011/10/01
- メディア: 大型本
- 購入: 4人 クリック: 254回
- この商品を含むブログ (16件) を見る
HiveとかPigを使わないでMapReduceを直に書く人が参考になりそうな本ですね。全部で7章あります。6章は難しいです。まあ3章まで読めばいいんじゃないですかねw
これに関しては以前、下記で書きました。
- Hadoop MapReduce デザインパターンの3章まで読んでみた。 - wyukawa’s blog
- Hadoop MapReduce デザインパターンの4章を読んでみた。 - wyukawa’s blog
- Hadoop MapReduce デザインパターンの5章を読んでみた。 - wyukawa’s blog
- Hadoop MapReduce デザインパターンの6,7章を読んでみた。 - wyukawa’s blog
いじょ。