Pigの情報源

とりあえずめもっとく

■本家

Welcome to Apache Pig!

Ver 0.9.2からドキュメントの量が増えているのでこれを読めば事足りるかも。

■書籍

Hadoop徹底入門

Hadoop徹底入門

11章に20ページほど書かれている。情報量としては少ないかな。

Hadoop 第2版

Hadoop 第2版

11章に40ページほど書かれている。入門としてはいいかも。

Hadoop Hacks ―プロフェッショナルが使う実践テクニック

Hadoop Hacks ―プロフェッショナルが使う実践テクニック

5章に30ページほど書かれている。custom storageの作り方を詳しく書いている。

Programming Pig: Dataflow Scripting with Hadoop

Programming Pig: Dataflow Scripting with Hadoop

洋書ですがPig単品について書かれた本。ページ数は200ページほどです。

パターンでわかるHadoop MapReduce ビッグデータのデータ処理入門 (NEXT‐ONE)

パターンでわかるHadoop MapReduce ビッグデータのデータ処理入門 (NEXT‐ONE)

パターンでわかるHadoop MapReduce ビッグデータのデータ処理入門 - wyukawa’s blogで紹介しました。

■ブログ

大規模なデータセットを効率的に扱うための Pig 超入門 - (゚∀゚)o彡 sasata299's blog

さらっと読むにはこれがいいかも

http://tech-sketch.jp/2012/08/hadoop-pig.html

Hiveとの比較が興味深い

■WEB記事

Pigメモ(Hishidama's Apache Pig Memo)
Nested Blockのことも含めていろいろ書かれてます。

■togetter

豚野郎 - Togetter
Pigについてのつぶやきをまとめました。

slideshare

p158からPigのことが書かれています。最後のほうにはSQLとの構文比較もあり参考になります。

Pigを使った開発フローに関する話が書かれてます。

HiveとPigの比較資料