例えば、csv で保存された以下のスキーマのテーブルがあったとする。
col1 int
col2 string
col3 int
ここで、以下のようなデータをLoadする。
1,hoge,fuga,10
そうすると、hive上は以下のように認識される。
col1 1
col2 hoge
col3 NULL
カラムがひとつズレてしまい、右にはみ出したカラムは無視される。
但し、データファイル上は元のままで、「1,hoge,fuga,10」という中身のファイルが存在している。
なお、col3がNULLになっているのは、数値項目に文字列「fuga」が入っているため。
http://d.hatena.ne.jp/wyukawa/20110713/1310550302