Python計算生態中那些著名的庫-文本處理

PyPDF2

用來處理pdf文件的工具集html

提供了一批處理PDF文件的計算功能,支持獲取信息、分隔/整合文件、加密解密等,徹底Python語言實現,不須要額外依賴,功能穩定python

官方網站:mstamy2.github.io/PyPDF2git

NLTK

天然語言文本處理第三方庫github

提供了一批簡單易用的天然語言文本處理功能,支持語言文本分類、標記、語法句法、語義分析等,是最優秀的Python天然語言處理庫工具

官方網站:www.nltk.org網站

Python-docx

建立或更新Microsoft Word文件的第三方庫加密

提供建立或更新.doc .docx等文件的計算功能,增長並配置段落、圖片、表格、文字等功能htm

官方網站:python-docx.readthedocs.io/en/latest/i…圖片

相關文章
相關標籤/搜索