摘要: MaxCompute你們都不陌生,以前產品名稱叫ODPS,以後隨國際化而改名。從支持阿里集團內部99%數據業務到計算能力對外輸出,幫助政府、互聯網公司、金融等進行大數據項目服務,使得數據變現。不少開發者都會把MaxCompute和開源社區Hadoop、hive進行比較,此處不作過多評論,各有優點。php
點擊查看原文html
MaxCompute你們都不陌生,以前產品名稱叫ODPS,以後隨國際化而改名。從支持阿里集團內部99%數據業務到計算能力對外輸出,幫助政府、互聯網公司、金融等進行大數據項目服務,使得數據變現。不少開發者都會把MaxCompute和開源社區Hadoop、hive進行比較,此處不作過多評論,各有優點。可是不得不說MaxCompute這幾年在生態上向前走了一大步。java
關於 MaxCompute2.0 對開源系統的支持與融合 的總體介紹及團隊規劃,詳見文檔。python
最近,我也針對MaxCompute在生態融合上也進行了一些研究和拜讀,由於如今資料還比較零散,就把本身在過程當中遇到的好材料統一爲你們梳理以下,包括SDK、JDBC等。git
首先咱們先來看SDK,想必不少有能力的互聯網公司都有大量的個性化需求,都會對SDK/API有一些需求,好比小黃車這樣的體量大的客戶,就基於MaxCompute SDK作了大量的應用。那具體SDK包括Java、Python、R以及PHP(PHP爲社區提供,並不是阿里雲官方出品,但均可以知足大部分需求)。github
更大強大的功能,你們能夠期待下團隊將在北京雲棲大會對外正式公測的python UDF,這將大大的提升python開發者對MaxCompute的開發效率和功能。sql
對接已有軟件並提供標準JDBC編程接口,MaxCompute JDBC 2.2正式版已於2017年2月24日正式發佈。數據庫
提供Hive Thrift協議兼容接口,對接Hive社區已有的工具。Hive Proxy 部署在客戶端,將 Hive 的 thrift 請求轉換成 MaxCompute 的 Restful API 請求,能夠用來直接對接諸如 Tableau、Qlik 這樣不直接支持 JDBC 的 BI 工具,或者 HPL 這樣的 Hive 組件,詳見 博文。編程
具體詳見:https://yq.aliyun.com/articles/61262ruby
關於Logstash將日誌採集MaxCompute,而後作數據分析有詳細step by step 文檔,點擊進入。