基於DBSCAN聚類算法的通用論壇正文提取

這是今年和隊友一起參加第五屆泰迪杯的賽題論文,雖然最終只獲得了一個三等獎。但是在這個過程中和隊友也一起學到了不少東西,特此記錄。 1、  簡單介紹 賽題的目的,是讓參賽者對於任意 BBS 類型的網頁,獲取其 HTML 文本內容,設計一個智能提取該頁面的主貼、所有回帖的算法。 http://www.tipdm.org/jingsa/1030.jhtml?cName=ral_100#sHref賽題地址
相關文章
相關標籤/搜索