DataWorks入門

阿里雲有不少成熟的雲產品(萌新認知),我本身只用過騰訊雲的對象存儲,對這類雲產品不是特別瞭解。html

有幸參與到大數據相關的項目,跟着學了點工具的使用方法,很是簡單,也瞭解了一些使用大數據分析問題的流程。sql

參考資料

  官方文檔->點擊跳轉數據庫

  在使用以前確定須要有帳號巴拉巴拉什麼的,根據官方文檔來就行了。oracle

臨時查詢

  臨時查詢能夠寫點相似sql的語句查查東西,建建表啥的。ide


  使用過程:臨時查詢->右鍵新建-新建節點-ODPS SQL->寫語句->運行語句函數

       這裏的SQL不是正經的SQL,他們本身有一個規範,具體參考官方文檔->點擊跳轉工具

CREATE TABLE test111 ( ID int COMMENT 'id' ,NAME STRING COMMENT '姓名' ) COMMENT '測試表111'
簡單建表
SELECT name ,age ,tel FROM test_jey WHERE age = 20
簡單查詢
DROP TABLE 表名 --刪表 TRUNCATE TABLE 表名 --清空表
其餘

 

  這裏使用的是按需版,select花錢,按數據的量算錢,最低一分,執行以前會告訴費用,能夠不運行。包月的就隨便查。測試

  在下方能夠看到日誌和查詢結果,在左邊的運行歷史也能夠看到語句、日誌和結果。大數據

建表

  很是簡單,能夠寫語句(選擇DDL模式裏面寫語句),也能夠在頁面上點點點來建表(我的比較喜歡)。阿里雲

  數據開發->帶+號的圖標->表(或者 表管理->帶+號的圖標)->表名->表結構信息->提交到生產環境

 

業務流程

  如下爲萌新理解:

    對大數據的分析確定很複雜,不是連幾個表查詢查詢就能解決的事情。在這裏能夠把你想實現的運算按步驟一個節點一個節點寫出來,有個可視化的節點,有利於整理思路,不至於寫着寫着就懵了(好比我這種小可愛

  左邊有不少能夠拖拽的東西。第一個數據集成的數據同步,數據同步的功能就是將數據從這裏(DataWorks裏,多是在這裏配置了阿里的ODPS,那豈不是又買了odps又買了dataworks)導出到別的數據源(各類數據庫、本身的、阿里的,不少種,oracle好像比較費勁),或者將其餘數據源的數據導入這裏。下面綠色的就是能夠用各類語言來算點東西,想用哪一個用哪一個。

  同時,這裏的每一步工做均可以定時來作(右側-調度配置)。由於大數據項目基本都不是死數據,都是逐漸增長的,因此分析也要常常更新。能夠設置每一年/月/日/小時/分鐘運行。

 

函數列表

  給了一些能夠用的函數(在sql語句中使用),很是方便,也能夠自定義函數。

相關文章
相關標籤/搜索