SQLflow:基於python開發的分佈式機器學習平臺, 支持經過寫sql的方式,運行spark, 機器學習算法, 爬蟲

簡書博客: https://www.jianshu.com/u/3fe...

百度雲搜索:http://www.lqkweb.com

搜網盤:http://www.swpan.cn

淘寶券搜索:http://www.wodecai.cn

淘寶券:http://www.tbquan.cn

你我搜:http://www.niwosou.cn

開源Flask+Bootstrap網址導航: http://hao.tbquan.cn

開發交流QQ羣: 941879291html

SQLflow (python3.6)

image

SQLflow based on python development, support to Spark, as the underlying distributed computing engine, through a set of unified configuration file to complete the batch, flow calculation, the Rest service development.前端

2019-03-26 更新後臺路由,前端抽取base模板並更新使用ajax方式執行sql語句

主頁:
<div align="center">

<img src="
https://upload-images.jianshu...; alt="SQLflow Logo" width="500px"></img>

</div>
結果頁:
<div align="center">

<img src="
https://upload-images.jianshu...; alt="SQLflow Logo" width="500px"></img>

</div>python

SQLflow

SQLflow 基於python開發, 支持經過寫sql的方式操做分佈式集羣, 數據處理, 機器學習、深度學習模型訓練, 模型部署, 分佈式爬蟲, 數據可視化等。git

Build

python3.6github

git clone https://github.com/lqkweb/sql...web

pip install -r requirements.txtajax

python manage.py算法

主頁:http://127.0.0.1:5000
腳本頁面:http://127.0.0.1:5000/script
單sql頁面:http://127.0.0.1:5000/sql sql

【注意:一、下載apache spark文件配置manage.py中的SPARK_HOME路徑。二、data.csv是放到sqlflow/data目錄中】apache

Usage

在腳本執行頁面:http://127.0.0.1:5000/script 輸入 select from A limit 3; 或者 select from A limit 3 as B; 生成臨時表A或者B

生成臨時表A數據:

select * from A limit 3;

生成臨時表B數據:

select * from A limit 3 as B;

打開單sql執行頁面:http://127.0.0.1:5000/sql, 直接就能夠用spark sql任意語法操做數據表A和數據表B了:

desc A
select * from A limit 2
select * from B limit 2

[注] "as B" 至關於建立了一個 B 臨時表。

一個簡單的sql操做spark集羣的Demo,是否是很簡單。

[附] sparksql doc: https://spark.apache.org/docs...

還有更多sql版黑科技,sql版scikitlearn, sqlspider, sqlcharts, sqlkeras深度學習平臺正在內測中!

正在新增sql版機器學習算法功能, 謝謝支持。

正在新增sql版爬蟲功能, 謝謝支持。

正在新增sql版數據可視化功能, 謝謝支持。

正在新增sql版keras深度學習功能, 謝謝支持。

記得給個star鼓勵一下!Thanks♪(・ω・)ノ


HitCount

相關文章
相關標籤/搜索