Hive の map数調整

http://www.cloudbb.jp/wp/archives/78

mapred.max.split.size
というパラメータで1Mapタスク当たりの最大のファイルサイズを指定できるらしい(Byte単位)。
mapred・・・という名前だが、あくまでHive用らしい。また、インプットが圧縮ファイルの場合は効かないらしい。