象本第二版の翻訳出たよ

Hadoop 第2版

Hadoop 第2版

第ー版の翻訳、第二版の原書(のepubデータ)を持っている身としては第二版を買うかは悩んだが結局買ってしまった。

書店で買ったのでHadoopのTシャツは持ってないです。欲しい方はこちらを見てください。http://www.oreilly.co.jp/sales/2011/07/web-direct-campaign-july-hadoop-tee.html

手に持つと重いw それもそのはず第ー版の翻訳が539ページに対して、第二版の翻訳は642ページあります。

比べるとこんな感じ

気になる差分ですが、

4.3.5にAvroの記述が追加されています。次世代シリアライザーション技術として気になりますね。

9.5にセキュリティの記述が追加されています。Kerberos認証の話ですね。この機能はどうもコミュニティ版には無くて(0.22では付きそう)CDHやYahooのディストリビューションに含まれているようです。この辺も大規模に運用するとなると必要でしょう。

12章にHiveの記述が追加されてます。結構突っ込んで書いてますね。動的パーティションインサートとかバケットとかRCFileとか。

15章にSqoopの記述が追加されています。Sqoopの情報ってあんまり見ない気がするので貴重ですね。

16.7にPigとWukongを使ったネットワークグラフの解析の記述が追加されています。

付録DにNTTデータの実証実験に関する記述が追加されてます。

これについては以前書きました。
NTTデータのHadoop報告書を読んでみた - wyukawa’s blog

ただ書籍での分量は6ページだけなので詳細を知りたい場合はオリジナルのPDF375ページ読まないとダメかもw