RSS博文抓取流程的設計

爲了後續RSS抓取和解析模塊的工作,仔細研究了一下RSS的格式,發現RSS訂閱其實有兩種格式,較早的RSS 2.0格式是由哈佛大學設計的並凍結了版權,後面爲了進行補充特性,由IETF主導規範了Atom協議 RSS 2.0 規範包含了摘要級別的標題、連接和描述,不需要再摘要中出現任何單獨項的字段,可以包含任何普通文本或者轉以後的html文本,但是沒有辦法分辨提供的是哪種格式 而Atom中對於概述和全
相關文章
相關標籤/搜索