摘要: 建立數據集是報表分析的基礎,合理建模能夠達到事半功倍的效果哦!sql
產品核心流程第二步爲建立數據集,進行數據建模,若是說數據是海,那麼建立數據集併合理建模就是划船的漿,有了漿才能在數據的海洋裏暢遊。目前建立數據集有兩種方式:(1)數據表直接建立數據集 (2)經過自定義sql建立數據集,以實現初步建模。函數
建立數據集:圖片
(1)直接新建數據集:get
以下圖,在數據源列表頁,找到目標表,點擊建立數據集按鈕並選擇存放文件夾 便可新建,新建後自動進入數據集界面。同步
(2)自定義sql建立數據集:產品
目前產品支持MaxCompute和MySQL數據源自定義sql建立數據集,能夠實現多表關聯、新增目標字段等。以下圖,點擊‘自定義SQL’進入編輯界面:基礎
目前自定義sql有部分規則須要注意:cli
MySQLselect
不支持函數列表:sql語句
MaxCompute
MaxCompute數據源原生支持函數便可。
常見問題
Q:MaxCompute數據源,爲何搜索不到目標表?
A:(1) MaxCompute數據源新建表須要約30分鐘來進行Meta同步,稍等一下喲,要保證同步表的用戶AccessID和AccessKey有效。
Q:MaxCompute數據源,建立表提示沒有權限?
A:申請權限,保證具備list、select、create instance權限。
Q:MaxCompute數據源數據集編輯界面刷新預覽數據報錯:
A:錯誤緣由:2018年1月10日 20點 新建立的項目(project)默認禁止分區表全表掃描,即對該項目的分區表執行全表掃描語句時會返回失敗。
1.指定分區條件,自定義sql在對分區表全表掃描的sql語句後加 ‘where pt = xxx’ 限制分區。
2.建立報表時對分區字段添加過濾。
Q:SqlServer、PostgreSQL、Oracle數據源,找不到對應表?
A: 請確認添加數據源schema是否正確
Q:自定義sql建立數據集,字段呈現下圖形式,刷新預覽數據報錯?
A:如上圖標識,字符類型用?打標,說明後期對該字段別名進行了修改。字段名稱先後有下劃線_ 說明字段別名中加了單引號。解決辦法:修改自定義sql並保存,在數據集編輯界面同步表結構,將錯誤字段刪除,保存數據集最後刷新預覽數據便可。
閱讀更多幹貨好文,請關注掃描如下二維碼: