轉-推薦引擎記錄1

最近推薦引擎成爲顯學,主要緣由應該是電子商務的蓬勃發展。頭些日子和圖靈的兩位老師吃飯,我甚至瞭解到由於推薦引擎以及機器學習領域的日漸火爆,圖靈出的線性代數最近銷量都很好,更別提你們如今處處均可以看到這個領域相關的招聘。我最近的創業項目iApp4Me其實也是一個推薦引擎的應用,我關注這個領域有很長一段時間了。這個領域還很新,還有不少未知的可能性,很是有意思。html

不過在我關注的過程當中,我發現不少人其實對什麼是推薦引擎只知其一;不知其二,這有點像5-6年前的技術界對搜索引擎的理解同樣,那時候有人曾在CSDN言之鑿鑿的說Google其實用的就是Mysql無非是服務器多,並且管理員水平高而已。雖然大多數的高校的計算機專業都有信息檢索課程,可是不少甚至是名校的畢業生也說不清楚搜索引擎是怎麼回事兒。web

事實上技術界開始對搜索引擎技術大規模的掃盲是從lucene這個開源軟件的出現之後開始的,在這個問題上某Cutting同窗居功至偉。後來也是在他組織下Lucene項目組開發孵化出來了Google的MapRuduce架構的開源實現Hadoop。在Yahoo、在阿里巴巴以及全世界不少公司和組織中Hadoop都起到了很大的做用。後來,lucene項目組還孵化了Mahout,一個基於Hadoop和Lucene的機器學習、推薦引擎項目。如今推薦引擎的實踐中,這個Mahout這個項目也起到了很大的做用。值得推薦的相關開源項目還有weka,Javaml,numpy等。算法

固然光有這些開源項目也是不夠的,若是你徹底不理解推薦引擎的理論,你也很難玩轉它。今天我發現了IBM開發者社區近期出現了一組文章《探索推薦引擎的祕密》,寫的很好,能夠算做很是好的這個領域的綜述的文章,很是適合給不瞭解或者只知其一;不知其二的人創建概念,因此在這裏推薦給你們。sql

相關文章
相關標籤/搜索