Hive の boolean の使い方

■ファイルからLoad

boolean のカラムに'true','false'の文字列を入れる。大文字小文字は問わない。
'true','false'以外の文字列や数値(1,0もダメ)が入っているカラムはnull扱い。

■WHERE句

WHERE column = true
WHERE column = false
とか。

WHERE column = 1
WHERE column = 0
としてもよい。1がtrueで0がfalse

nullのレコードを抜くには
WHERE column is null
とする
= null ではエラーにはならないが、何も引っかからない。

■JOIN

普通に ON (bool1 = bool2) みたいな感じで。
但し、nullのレコードは何ともJOINされないっぽい。(null同士でJOINされる訳ではない。)