2012-07-13から1日間の記事一覧

hadoopのsortフェーズでのソート順について

当然だが、map出力の型をText とかにすると、文字列としてソートされ、IntWritableとかにすると数値としてソートされる。 数値項目は、0パディングするか、適切なWritableを指定しないと意図しないソート順になる。 特にセカンダリ・ソートを行う場合は要注…