天然語言處理
ScalaNLP—機器學習和數值計算庫的套裝
Breeze —Scala用的數值處理庫
Chalk—天然語言處理庫。
FACTORIE—可部署的機率建模工具包。用Scala實現的軟件庫。ios
爲用戶提供簡潔的語言來建立關係因素圖。評估參數並進行判斷。
git
數據分析/數據可視化
MLlib in Apache Spark—Spark下的分佈式機器學習庫
Scalding —CAscading的Scala接口
Summing Bird—用Scalding 和 Storm進行Streaming MapReduce
Algebird —Scala的抽象代數工具
xerial —Scala的數據管理工具
simmer —化簡你的數據,進行代數聚合的unix過濾器
PredictionIO —供軟件開發人員和數據project師用的機器學習server。
BIDMat—支持大規模探索性數據分析的CPU和GPU加速矩陣庫。
通用機器學習
Conjecture—Scalding下可擴展的機器學習框架
brushfire—scalding下的決策樹工具。
ganitha —基於scalding的機器學習程序庫
adam—使用Apache Avro, Apache Spark 和 Parquet的基因組處理引擎,有專用的文件格式,Apache 2軟件許可。
bioscala —Scala語言可用的生物信息學程序庫
BIDMach—機器學習CPU和GPU加速庫。
Figaro - 一個構造機率性模型的Scala庫github
英文原文連接:Scala機器學習框架