1.安裝impylabash
pip install impyla
2.在superset頁面配置以下,此時impala是有kerberos認證的測試
impala://xxxx:xx/default?auth_mechanism=GSSAPI&kerberos_service_name=impala
若是遇到下面的問題,是thrift-sasl版本太高spa
The error message returned was:\n'TSocket' object has no attribute 'isOpen'
降級爲0.2.1版本就能夠3d
pip list | grep thrift-sasl thrift-sasl 0.3.0 pip install thrift-sasl==0.2.1
測試,okblog
查詢ip
當將thrift-sasl從0.3.0降級爲0.2.1以後,鏈接hive會報ci
from pyhive import hive ImportError: cannot import name 'constants'
解決方法是將原來hive的uri從it
hive://xxx:xxx/default?auth=KERBEROS&kerberos_service_name=hive
修改成pip
impala://xxx:xxx/default?auth_mechanism=GSSAPI&kerberos_service_name=hive
同時附上impala和hive查詢的時間對比,impala要快不少class
hive
impala
其中city爲array,在impala中不能使用select語句來查詢,由於impala中select語句只支持標量
若是要在impala中查詢array中的數據,須要這麼查
select * from default.arraydemo, default.arraydemo.city
結果,這是將array中的數據進行了展平