Python實現文章自動生成

下面的Python程序實現了經過從網頁抓取一篇文章,而後根據這篇文章來生成新的文章,這其中的原理就是基於機率統計的文本分析。   過程大概就是網頁抓取數據->統計分析->生成新文章。網頁抓取數據是經過BeautifulSoup庫來抓取網頁上的文本內容。統計分析這個首先須要使用ngram模型來把文章進行分詞並統計頻率。由於文章生成主要依據馬爾可夫模型,因此使用了2-gram,這樣能夠統計出一個單詞出
相關文章
相關標籤/搜索