項目開發文檔

項目開發文檔 項目流程 採用自頂向下的構建方式,先確定知識圖譜的數據模型,再根據模型去填充具體數據,最終形成知識圖譜。 數據來源 現階段是使用爬蟲直接獲取結構化的數據 如 消化內科科 —> 胃炎 等直接使用 xpath 獲取實體和關係 後續可能要對半結構化(mongo)或者非結構化(html)的數據進行識別抽取 相關資料 知識抽取 獲取可信度較高的網站的數據 使用爬蟲爬取 醫院、醫生、科室、疾病、
相關文章
相關標籤/搜索