2011-07-01から1日間の記事一覧

HadoopのSequenceFileのフォーマット

Hadoopのワードカウントの例だとテキスト形式の入力ファイルが出てきますが、 Hadoopではそれ以外にもバイナリ形式のKey-Valueレコードを保存するためのフォーマットとしてSequenceFileというのがあります。Hadoopは容量が少ないファイルを大量に扱うのは苦…