hiveのloadコマンドに謎の制約
LOAD DATA LOCAL INPATH '/dir/_hoge' ...
みたく、ファイル名が “_” 始まりのファイルをLOADしようとしたら、何故か「そんなファイルはねえ!」と怒られエラーになった。
回避策としては、頭にワイルドカード入れる。以下なら正常終了。
LOAD DATA LOCAL INPATH '/dir/*hoge' ...
Hive 1.2.1000.2.5.0.0-1245 (HDP 2.5.0.0-1245) にて確認。
Mapper/ReducerではrunというメソッドもOverrideできる
ということを今更知った。 runのデフォルトの実装の中で、setup, map/reduce, cleanup を呼び出している。
Mapper (Apache Hadoop Main 2.7.3 API)