集體智慧學習編程——自我改編應用

學習目標: 1、利用博客資源自我創建數據集; 2、利用皮爾遜相關度描述單個數據之間的緊密度; 3、對從新浪博客爬取的博客進行分類; 4、繪製樹狀圖。 一、利用博客資源創建數據集: 我這裏選取的是新浪博客,例如http://roll.finance.sina.com.cn/blog/blogarticle/cj-bkks/inde_1.shtml, 其中url中數字1是頁碼。基於這個規律,可以抓取很
相關文章
相關標籤/搜索