SQLflow:基於python開發的分佈式機器學習平臺, 支持經過寫sql的方式,運行spark, 機器學習算法, 爬蟲

時間 2019-12-12

標籤 sqlflow 基於 python 開發分佈式機器學習平臺支持經過 sql 方式運行 spark 算法爬蟲欄目 Python 简体版

原文原文鏈接

簡書博客: https://www.jianshu.com/u/3fe...

開源Flask+Bootstrap網址導航: http://hao.tbquan.cn

開發交流QQ羣: 941879291html

SQLflow (python3.6)

SQLflow based on python development, support to Spark, as the underlying distributed computing engine, through a set of unified configuration file to complete the batch, flow calculation, the Rest service development.前端

2019-03-26 更新後臺路由,前端抽取base模板並更新使用ajax方式執行sql語句

主頁：
<div align="center">

<img src="https://upload-images.jianshu...; alt="SQLflow Logo" width="500px"></img>

</div>
結果頁：
<div align="center">

<img src="https://upload-images.jianshu...; alt="SQLflow Logo" width="500px"></img>

</div>python

SQLflow

SQLflow 基於python開發, 支持經過寫sql的方式操做分佈式集羣, 數據處理, 機器學習、深度學習模型訓練, 模型部署, 分佈式爬蟲, 數據可視化等。git

Build

python3.6github

git clone https://github.com/lqkweb/sql...web

pip install -r requirements.txtajax

python manage.py算法

主頁：http://127.0.0.1:5000
腳本頁面：http://127.0.0.1:5000/script
單sql頁面：http://127.0.0.1:5000/sql sql

【注意：一、下載apache spark文件配置manage.py中的SPARK_HOME路徑。二、data.csv是放到sqlflow/data目錄中】apache

Usage

在腳本執行頁面：http://127.0.0.1:5000/script 輸入 select from A limit 3; 或者 select from A limit 3 as B; 生成臨時表A或者B

生成臨時表A數據:

select * from A limit 3;

生成臨時表B數據:

select * from A limit 3 as B;

打開單sql執行頁面：http://127.0.0.1:5000/sql, 直接就能夠用spark sql任意語法操做數據表A和數據表B了:

desc A
select * from A limit 2
select * from B limit 2

[注] "as B" 至關於建立了一個 B 臨時表。

一個簡單的sql操做spark集羣的Demo,是否是很簡單。

[附] sparksql doc: https://spark.apache.org/docs...

還有更多sql版黑科技，sql版scikitlearn, sqlspider, sqlcharts, sqlkeras深度學習平臺正在內測中！

正在新增sql版機器學習算法功能, 謝謝支持。

正在新增sql版爬蟲功能, 謝謝支持。

正在新增sql版數據可視化功能, 謝謝支持。

正在新增sql版keras深度學習功能, 謝謝支持。

記得給個star鼓勵一下！Thanks♪(･ω･)ﾉ

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。