【資源聚合平臺】5/30日工作日誌

梁惠欣 成功使用wiki的語料庫訓練了word2vec方法。但是,由於語料庫所含文本與我們的技術專欄,提取摘要效果很差。 不太適用於我們的情況。 正在爬取技術博客文章作爲語料庫訓練集。 改ui,明天繼續改 邵長旭 現在能發圖片了,實際是現在的內容存的html代碼,所以能解析img圖片,但是這樣在生成摘要時直接截取前幾個就不行了,做摘要提取的時候要先把各種html標籤去掉,再生成摘要: 現在詳情頁面
相關文章
相關標籤/搜索