24個終極數據科學項目(可免費獲取資源)

集羣配置參數:node

  cluster-enabled yes     //開啓集羣redis

  cluster-config-file nodes.conf    //保存集羣信息的文件算法

  cluster-node-timeout 5000         //集羣節點超時時間ruby

集羣環境準備:網絡

  集羣管理工具redis-trib是由ruby語言研發的,須要先安裝ruby的依賴關係及環境;ide

  redis的源碼文件中有一個管理工具,是用ruby寫的,因此須要安裝ruby相關的軟件;工具

  yum install ruby rubygems -y學習

  gem install redis spa

    注:國內訪問內過慢請參考此網址--> http://gems.ruby-china.org/.net

    $ gem update --system # 這裏請利用外網

    $ gem -v

    2.6.3

 

    $ gem sources --add https://gems.ruby-china.org/ --remove https://rubygems.org/

    $ gem sources -l

    https://gems.ruby-china.org

    # 確保只有 gems.ruby-china.org

  注:若是遇到 SSL 證書問題,你又沒法解決,請直接用 http://gems.ruby-china.org 避免 SSL 的問題

  即:$ gem sources --add http://gems.ruby-china.org/ --remove https://rubygems.org/

利用redis-trib建立集羣:

  cp /usr/local/src/redis-3.2.0/src/redis-trib.rb /usr/local/bin/redis-trib

  注:redis-trib.rb就是用ruby寫的集羣管理工具

  注:若是是二進制安裝的,沒有redis-trib文件,則須要去下載源碼文件,複製源碼文件中redis-trib

建立集羣:

  注:集羣中最少爲3個節點  

數據科學項目爲你在這個領域的深刻研究提供了一個基礎。經過實際應用,你不只能夠學習數據科學,也可以寫在簡歷中提高你的資歷。在這上邊花費的時間越多,你學到的知識就越多。

本文精選了24個數據科學項目,並囊括了各個領域和各類不一樣大小的數據集。另外,全部的數據集都是開源、可免費獲取的。

171117588eed5cfb10de9a61c8679ef90508d709 

初級——這部分的數據集很容易處理,使用基礎的迴歸/分類算法就能夠處理這些數據集。而且,這些數據集有足夠的教程供你學習。

中級——略微有點難度。包含了須要使用有點難度的模式識別技能來處理的大中型數據集。另外,特徵工程在這裏能夠發揮做用了。

高級——包括神經網絡、深度學習、推薦系統及高維數據等。

初級

1.Iris Data數據集(花的類別識別)

a7757ce811e789e37001a1fdeaee93a2b53f0744 

Iris Data Set多是模式識別領域學習分類技術基本入門級的數據集,適合初學者該數據集裏面包含了150行4列數據。

問題: 根據已有特徵預測花的類別
資源:數據 教程

2.Loan Prediction 數據集(貸款預測)

7331cb081d795a1deb94607caaa55d1c42c83ee2 

是保險領域最常引用的一個數據集。利用這個數據集,你能夠充分體驗到如何處理保險公司的數據包括會遇到哪些挑戰須要什麼策略哪些變量會影響結果等。這是一個分類問題數據集包含615行13列個數據

redis-trib create --replicas 1 127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005 127.0.0.1:7006

  注:建立後前3個爲主,後3個爲從

相關文章
相關標籤/搜索