利用python從《牛津高階英漢詞典》裏提取單詞列表

從網上下載的《牛津高階英漢詞典》是以文本的形式存在於A-Z的文件夾中。每個文件夾有多個文件。如圖: 文件夾A裏的文件有: 其它文件夾基本也是多個文件。 基本思路是通過文件夾遍歷找出所有文件。然後對這些文件逐個應用正則表達式進行搜索,提取單詞列表。經過前面若干天的學習,填了一個又一個坑,現在可以給出一個比較成熟的代碼了。 import re p=re.compile(r"\b[-a-z]{2,40
相關文章
相關標籤/搜索