本文來自網易雲社區。python
經常使用的數據挖掘軟件仍是有不少的,各有千秋。對學習數據挖掘的學生來講,如何選擇確實是道難題,下面就介紹一下幾種經常使用的挖掘軟件的特色,供你們參考。算法
數據挖掘軟件首推R,它的優勢在於函數都給你寫好了,你只須要知道參數的形式就好了,有時候即便參數形式不對,R也能「智能地」幫你適應。這種簡單的軟件適合想要專一於業務的人。數據庫
R做爲一款用於統計分析和圖形化的計算機語言及分析工具,爲了保證性能,其核心計算模塊是用C、C++和Fortran編寫的。同時爲了便於使用,它提供了一種腳本語言,即R語言。R支持一系列分析技術,包括統計檢驗、預測建模、數據可視化等等。編程
R軟件的首選界面是命令性界面,經過編寫腳原本調用分析功能。若是缺少編程技能,也可以使用圖形界面,好比使用R Commander。機器學習
其次是Python,Python幾乎均可以作(通用性語言),函數比R多,比R快。可是缺點是比R難學一點。它是一門語言,R更像是一種軟件,因此python更能開發出flexible的算法。它的語言簡單易懂,作分析方便,並且能夠開發大型軟件。函數
其它數據挖掘軟件用的並非不少,可是能夠結合知友的回答推薦幾款,經常使用的數據挖掘軟件仍是有不少的,各有千秋。工具
發掘數據集的模式,其描述性和預測性模型爲用戶更深刻的理解數據提供了基礎。用戶不須要寫任何代碼,它們提供易於使用的GUI,並提供從數據處理、集羣到最終環節的自動化工具,用戶能夠從中得出最佳結果作出正確決策。性能
一款很是複雜的數據挖掘工具,也多是名氣最大的開源機器學習和數據挖掘軟件。其原生的非Java版本主要是爲了分析農業領域數據而開發的。該工具基於Java版本,支持多種標準數據挖掘任務,包括數據預處理、收集、分類、迴歸分析、可視化和特徵選取。高級用戶能夠經過Java編程和命令行來調用其分析組件。同時,Weka也爲普通用戶提供了圖形化界面。學習
同時它還支持幾種經典的數據挖掘任務,顯著的數據預處理,集羣,分類,迴歸,虛擬化,以及功能選擇。其技術基於假設數據是以一種單個文件或關聯的,每一個數據點都被許多屬性標註。 Weka 使用Java的數據庫連接能力能夠訪問SQL數據庫,並能夠處理一個數據庫的查詢結果。高級用戶能夠經過Java編程和命令行來調用其分析組件。同時,Weka也爲普通用戶提供了圖形化界面。和R相比,Weka在統計分析方面較弱,但在機器學習方面要強得多。大數據
更多詳細內容可參考:你常用的數據挖掘軟件/軟件包有哪些?有什麼優勢?
在使用數據挖掘軟件/軟件包的過程當中,若能結合大數據分析處理平臺,
並能將常用的軟件包嵌入其中,分析處理數據必會事倍功半。
利益相關:網易的猛獁大數據平臺是一站式的數據開發平臺,支持各類經常使用的數據挖掘軟件/軟件包,敏捷的開發模式,簡單的拖拽節點便可進行任務開發,支持數據庫傳輸節點、SQL、Cube、MR、Spark、Script等多種節點任務,內嵌的軟件包簡化了數據開發人員和數據分析人員冗餘的工做環境,使他們更加關注業務自己。
歡迎點擊這裏免費試用網易猛獁。
原文:對學習數據挖掘的學生來講,學習哪一種統計分析軟件更好? r語言、sas、stata、spss 或者其餘更好的推薦?