2012-08-02から1日間の記事一覧

Hadoop セカンダリソートについて

象本にもちゃんと書いてあるが、まとめ。例えば、以下のようなデータがあるとする。A1 B11 C11 A1 B12 C12 A1 B13 C13 A2 B21 C21 A2 B22 C22 A2 B23 C23 A2 B24 C24これを、カラムAの値毎にまとめてReducerで処理し、各Reducer呼び出し内ではカラムBの値順…