第一章 Weka命令行入門 算法
1.1簡介 機器學習
在最初的實驗,Weka所包含的圖形用戶界面是至關足夠,若深刻使用則建議使用命令行界面,由於它提供了一些功能(這些功能在圖形用戶界面下不可用) - 並使用少得多的內存。若是你遇到 內存不足 錯誤,提升您的Java引擎最大堆的大小,一般是經過設置 -Xmx1024M 或 -Xmx1024m 使最大堆大小爲1GB,默認設置16到64MB一般過小。若是你遇到找不到類的錯誤,請檢查你的 CLASSPATH:它是否包括 weka.jar? 您也能夠經過命令行選項 -cp 顯式設置 CLASSPATH 。 工具
咱們將經過描述基本概念和思想開始。而後,咱們將介紹 weka.filters, 包,它是用來變換輸入數據,如進行預處理,轉換,特徵生成等。 學習
而後,咱們將專一於機器學習算法自己。這些在Weka中叫分類。咱們將只關注全部分類方法的經常使用設置,但會稍微提到機器學習全部主要學習方法的典型例子。 開發工具
以後,會給出實際的例子。 spa
最後,在Weka的doc目錄,你能夠找到一個Weka中全部Java類的文檔。準備好使用它,由於本概述並不旨在提供完整描述。若是你想知道究竟是怎麼回事,去看大多都有着良好註釋的源代碼,源代碼在 weka-src.jar中,能夠經過Java開發工具包的jar程序解壓(或任何能夠處理ZIP文件的存檔提取程序)。 命令行
-------------------------------------------------------------------- 內存
原文在Weka手冊對應章節 開發