Weka開發[2]-分類器類

       此次介紹如何利用weka裏的類對數據集進行分類,要對數據集進行分類,第一步要指定數據集中哪一列作爲類別,若是這一步忘記了(事實上常常會忘記)會出現Class index is negative (not set)!這個錯誤,設置某一列爲類別用Instances類的成員方法setClassIndex,要設置最後一列爲類別則能夠用Instances類的numAttributes()成員方法獲得屬性的個數再減1java

    而後選擇分類器,比較經常使用的分類器有J48NaiveBayesSMOLibSVMJava版的,能夠在weka中使用,但要設置路徑),訓練分類器使用J48buildClassifier(注意J48還有別的分類器它們都繼承自Classifier類,使用方法都差很少),分類數據用J48類中的classifyInstance方法,例中使用的數據集爲contact-lenses.arff,分類結果爲2.0,結果爲2.0的緣由是:首先用文本編輯器打開數據集,有一行爲@attribute contact-lenses {soft, hard, none},而第一個樣本爲young, myope, no, reduced, none,最後一列爲類別,也就是contact-lences爲類別,第一個樣本的類別爲none,在屬性說明中none爲第二個因此爲2.0(從0開始數)。編輯器

package instanceTest;
 
import java.io.FileReader;
 
import weka.classifiers.trees.J48;
import weka.core.Instances;
 
public class ClassifierTest
{
    private Instances m_instances = null;
    
    public void getFileInstances( String fileName ) throws Exception{
        FileReader frData = new FileReader( fileName );
        m_instances = new Instances( frData );
        m_instances.setClassIndex( m_instances.numAttributes() - 1 );
    }
    
    public void classify() throws Exception{
        J48 classifier = new J48();
        //NaiveBayes classifier = new NaiveBayes();
        //SMO classifier = new SMO();
        
        classifier.buildClassifier( m_instances );
        System.out.println( classifier.classifyInstance( m_instances.instance( 0 ) ) );
    }
    
    public static void main( String[] args ) throws Exception{
        ClassifierTest ctest = new ClassifierTest();
        ctest.getFileInstances( "F://Program Files//Weka-3-4//data//contact-lenses.arff");
        ctest.classify();
    }
}
相關文章
相關標籤/搜索