連接:http://www.cs.waikato.ac.nz/ml/weka/index.htmlhtml
一簡介:算法
WEKA的全名是懷卡託智能分析環境(Waikato Environment for Knowledge Analysis),WEKA做爲一個公開的數據挖掘工做平臺,集合了大量能承擔數據挖掘任務的機器學習算法,包括對數據進行預處理,分類,迴歸、聚類、關聯規則以及在新的交互式界面上的可視化。數據庫
>術語:WEKA所處理的數據集是一個二維的表格,表格裏的一個橫行稱做一個實例(Instance),至關於統計學中的一個樣本,或者數據庫中的一條記錄。 豎行稱做一個屬性(Attribute),至關於統計學中的一個變量,或者數據庫中的一個字段。這樣一個表格,或者叫數據集,在WEKA看來,呈現了屬性之 間的一種關係(Relation)。機器學習
>數據準備:WEKA存儲數據的格式是ARFF(Attribute-Relation File Format)文件,這是一種ASCII文本文件。同時其還提供了對CSV文件的支持,而這種格式是被不少其餘軟件所支持的。此外,WEKA還提供了經過JDBC訪問數據庫的功能。具體參見:百度百科http://baike.baidu.com/view/1380214.htmpost
二:Knime開源數據挖掘軟件學習
http://www.oschina.net/question/12_14026能夠結合WEKA 使用的編碼
參考書:http://www.cs.waikato.ac.nz/ml/weka/book.htmlspa
相關項目:http://weka.wikispaces.com/Related+Projects.net
三:weka初級入門教程學習orm
參見:http://www.ibm.com/developerworks/cn/opensource/os-weka2/index.html