1.問題描述sql
使用Impala JDBC向Kudu表中插入中文字符,插入的中文字符串亂碼,中文字符串被截斷。函數
繼以前文檔使用sql拼接方式插入中文字符串亂碼解決方法後,此文檔描述使用jdbc的PreparedStatement方式插入中文字符串亂碼問題。測試
2.問題復現code
測試環境:blog
1.使用ImpalaJDBC代碼進行測試,測試代碼ip
staticString JDBC_DRIVER ="com.cloudera.impala.jdbc41.Driver"; static String CONNECTION_URL ="jdbc:impala://ip-172-31-10-118:21050/default"; public static void main(String[] args) { Connection con = null; ResultSetrs = null; PreparedStatementps = null; try { Class.forName(JDBC_DRIVER); con =DriverManager.getConnection(CONNECTION_URL); Stringsql2 = "insert into my_first_table values(?, ?)"; ps =con.prepareStatement(sql2); ps.setInt(1,81); ps.setString(2,"測試中文字符"); ps.execute(); ps.close(); ps =con.prepareStatement("select * from my_first_table order byid asc"); rs = ps.executeQuery(); while (rs.next()){ System.out.println(rs.getLong(1)+ "\t" +rs.getString(2)); } } catch (Exceptione) { e.printStackTrace(); } finally{ try {// 關閉rs、ps和con rs.close(); ps.close(); con.close(); } catch(SQLException e) { // TODOAuto-generated catch block e.printStackTrace(); } } }
2.向Kudu表中分別插入測試數據,如「測試」,「測試中文」,「測試中文字符」文檔
String sql2 = "insert into my_first_table values(?, ?)"; ps = con.prepareStatement(sql2); ps.setInt(1, 73); ps.setString(2, "測試"); ps.execute(); ps.close(); ps = con.prepareStatement(sql2); ps.setInt(1, 74); ps.setString(2, "測試中文"); ps.execute(); ps.close(); ps = con.prepareStatement(sql2); ps.setInt(1, 75); ps.setString(2, "測試中文字符"); ps.execute(); ps.close();
經過Hue查詢結果以下:字符串
中文字符所有亂碼,部分亂碼,字符串被截斷問題重現。get
3.解決方法string
修改程序中插入語句,將插入字符串列使用cast函數轉成String類型
String sql2 = "insert into my_first_table values(?, cast(?as string))"; ps = con.prepareStatement(sql2); ps.setInt(1, 60); ps.setString(2, "測試中文字符"); ps.execute(); ps.close(); ps = con.prepareStatement(sql2); ps.setInt(1, 61); ps.setString(2, "測試中文"); ps.execute(); ps.close(); ps = con.prepareStatement(sql2); ps.setInt(1, 62); ps.setString(2, "測試"); ps.execute(); ps.close();
修改後從新向Kudu中插入測試數據:「測試中文字符」,「測試中文」,「測試」
使用Hue查詢顯示以下:
中文字符串插入Kudu顯示正常。
醉酒鞭名馬,少年多浮誇! 嶺南浣溪沙,嘔吐酒肆下!摯友不願放,數據玩的花!