Python小說文本挖掘正則表達式分析案例

原文連接:http://tecdat.cn/?p=5673     約瑟夫·海勒的《第二十二條軍規》是我最喜歡的小說。我最近讀完了 ,並喜歡整本書中語言的創造性使用和荒謬人物的互動。對於個人可視化類,選擇文本做爲個人最終項目「數據集」是一個簡單的選擇。   數據集 該文有大約175,000個單詞,分爲42章。我在網上找到了這本書的原始文本版本並開始工做。正則表達式 我使用正則表達式和簡單字符串匹
相關文章
相關標籤/搜索