sqoop clob從Oracle導入到hive 回車換行致使記錄增多

sqoop import --hive-import --hive-overwrite  --connect jdbc:oracle:thin:@192.168.92.136:1521:cyporcl --username ODS --password 'od154DS$!('  -m 1  --hive-database ODS --table Q_TRA_DISPUTESTATUS --fields-terminated-by '\001' --hive-drop-import-delims  --null-string '\\N' --null-non-string '\\N'  --map-column-java DISPUTERESULT=Stringjava

DISPUTERESULT 這個字段是Oracleclob 類型的,裏面有回車, 加載到hive 裏面致使 記錄增多。oracle


--map-column-java和--map-column-hive兩個參數都要顯示給出;還須要設置--hive-drop-import-delims這樣才能順利導出數據。ide

.導入的列有換行符如何解決
本覺得萬事大吉,萬萬沒想到導入的列有nclob類型,裏面存儲了一篇篇文章,勢必有着換行符。果不其然,hive查詢數據所有錯亂, 查詢資料發現--hive-delims-replacement(替換/n,/r等符號用你指定的字符)和--hive-drop-import-delims參數。可添加上去發現並無什麼卵用,沒有起做用。百度goole好久,終於發現一篇帖子,http://stackoverflow.com/questions/28076200/hive-drop-import-delims-not-removing-newline-while-using-hcatalog-in-sqoop
意思是要用--map-column-java參數來顯示指定列爲String類型。個人解決方案爲 --map-column-java 個人CLOB列=String 果真,問題解決,換行符所有被去掉。不過據說改變存儲格式 或許也能夠避免這個問題,但願有着經驗的大神來回答一下。總結下來就這麼多,但願能幫助你們oop

相關文章
相關標籤/搜索