7.一、閱讀推薦html
先來看一段文字(摘自36kr):web
」北京十分科技也很是看好閱讀推薦類的應用,他們花了很是大的精力(一年60人團隊),纔在今天推出了iPhone 版「酷雲閱讀」。算法
爲何要投入這麼多人去作這個閱讀應用?CEO 李鵬告訴我,這個團隊超過一半的人都在作後臺相關的東西,包括語義分析、機器學習等算法。他們的目的是將互聯網「語義化」之後,把人的興趣明確,最後把每一個人感興趣的內容推薦給相關的人。在iPhone 上,酷雲的大體作法和Zite iPad 版相似,用戶的行爲也是有「喜歡」、「不喜歡」,以及點擊相應的媒體來源或者相關的標籤來告訴酷雲你但願之後看到更多這些內容。數據庫
這個目的是大部分閱讀推薦應用都有的,可是酷雲的作法彷佛更加變態。他們除了天天要抓取來自互聯網的超過10萬篇文章以外,還對全國200個的電視臺播出的視頻內容進行了索引,以便用戶也能夠經過文字搜索出視頻、以及對視頻內容進行同樣的推薦。大體作法是先把這些節目都錄製下來,而後把聲音轉文字,最後創建摘要和索引。「編程
根據所聽歌曲的重複相似斷定爲好友從而基於用戶的協同過濾進行推薦,經過某些歌曲是差很少相似的來基於項目的協同過濾進行推薦,但問題出來了,重複的好說,同一首歌曲同一個歌手嘛,可那些類似音樂歌曲又如何定義斷定呢?經過系統去分析歌曲的頻譜?區別各個歌曲節奏的快慢,音頻?此舉雖然看起來有效,但實際實行起來不太現實。數據結構