Superset配置impala數據源

1.安裝impylabash

pip install impyla 

 2.在superset頁面配置以下,此時impala是有kerberos認證的測試

impala://xxxx:xx/default?auth_mechanism=GSSAPI&kerberos_service_name=impala

若是遇到下面的問題,是thrift-sasl版本太高spa

The error message returned was:\n'TSocket' object has no attribute 'isOpen'

 降級爲0.2.1版本就能夠3d

pip list | grep thrift-sasl
thrift-sasl            0.3.0      
pip install thrift-sasl==0.2.1

測試,okblog

查詢ip

 

當將thrift-sasl從0.3.0降級爲0.2.1以後,鏈接hive會報ci

from pyhive import hive ImportError: cannot import name 'constants'

解決方法是將原來hive的uri從it

hive://xxx:xxx/default?auth=KERBEROS&kerberos_service_name=hive

 修改成pip

impala://xxx:xxx/default?auth_mechanism=GSSAPI&kerberos_service_name=hive

同時附上impala和hive查詢的時間對比,impala要快不少class

hive

impala

其中city爲array,在impala中不能使用select語句來查詢,由於impala中select語句只支持標量

若是要在impala中查詢array中的數據,須要這麼查

select * from default.arraydemo, default.arraydemo.city

結果,這是將array中的數據進行了展平

相關文章
相關標籤/搜索