集成學習方法是指訓練多個學習器並將它們組合使用。Boosting和Bagging是集成方法的主要表明,它們是目前主流的集成學習方法。衆所周知,集成學習一般比單個學習器更加精準,而且集成學習在真實世界的許多工做中已經取得很大成功。
咱們很難追溯集成方法的起源,由於基礎的部署多個模型的思想已經在人類社會應用了很長時間。可是,很顯然集成學習已成爲一個熱門話題,由於20世紀90年代,來自各個領域的研究人員(如機器學習、模式識別、數據挖掘、神經網絡以及統計數據),便開始從不一樣方面研究集成學習。
本書可供想了解集成方法的研究人員、學生和從業者使用。全書共分爲八個章節,這些章節天然地組合成三個部分。
第一部分由第一章組成。雖然本書主要爲有機器學習和模式識別基本背景知識的讀者準備,但爲了讓不熟悉這些領域的讀者可以讀懂本書的主要內容,第一章介紹了集成學習方法的一些「基本知識」。咱們不可能在一個章節中詳細介紹全部的背景知識,所以本章主要做爲進一步研究的指導。同時,本章也用來解釋本書中用到的一些術語,避免因不一樣相關領域中使用的其餘術語致使的混淆。
網絡