言歸正傳,開始介紹Weka,先google一下,把Weka軟件下載下來,在Weka的目錄中有一個weka.jar的包。java
把包添加到工程中後,就能夠調用weka中的函數了。編輯器
再介紹一點weka的基本知識,在weka的目錄下,有一個data的文件夾,裏面存放的是一些數據集,以第一個數據集contact-lenses.arff爲例,用EditPlus或是別的編輯器打開數據集,以%開頭的表示的是一些註釋,@relation表示這個數據集的名字,@attribute 表示屬性的屬性,@data 後就是數據集了,通常來講最後一列是類別(在LibSVM中第一列是類別)。函數
下面我寫了一個微不足道的一個weka的入門代碼:
google
package instanceTest; import java.io.FileReader; import weka.core.Instances; public class InstanceTest { public static Instances getFileInstances( String fileName ) throws Exception { FileReader frData = new FileReader( fileName ); Instances data = new Instances( frData ); return data; } public static void main(String[] args) throws Exception { Instances instances = getFileInstances( "F://Program Files//Weka-3-4//data//contact-lenses.arff"); //把數據集所有輸入出 //System.out.println( instances ); //用numInstances能夠得到數據集中有多少樣本 for( int i = 0; i < instances.numInstances(); i++ ) { //instance( i )是獲得第i個樣本 System.out.println( instances.instance( i ) ); } } }