本文正在參加「Python主題月」,詳情查看 活動連接python
python 能被稱做最方便的語言不是沒有道理的它的第三方庫功能強大到毀天滅地(開個玩笑)redis
下面就介紹幾個特別好用的第三方庫給你們提個方向,想詳細研究的小夥伴能夠到官網查查那麼開始。算法
•requests[1] 最好用、最簡單的網絡爬蟲訪問庫sql
•BeautifulSoup[2] 最簡單的網頁解析庫數據庫
•pyquery[3] 最簡潔網頁解析庫瀏覽器
•scrapy[4] 最流行的爬蟲框架緩存
•pyspider[5] 國人開發的爬蟲框架markdown
•selenium[6] 瀏覽器自動化框架,能夠用於爬蟲反爬網絡
•scylla[7] 智能IP代理池,用於反爬echarts
•shreport[8] 上海證券交易所上市公司按期報告下載
•newspaper[9] 新聞爬蟲庫,根據提供的url能夠抽取出新聞標題、做者、關鍵詞、總結,部分功能支持中文
•PyMySQL[10]
•Sqlite3[11] 輕量級sql數據庫(python內置庫)
•pymongo[12] 非關係型MongoDB庫
•redis 緩存數據庫
•pandas[13] 必須Python數據分析庫,讀取文件、預處理數據、分析、存儲
•modin[14] pandas加速庫,接口語法與pandas高度一致
•dask[15] pandas加速庫,接口語法與pandas高度一致
•plydata[16] pandas管道語法庫
•networkx[17] 社交網絡分析庫
•scikit-learn[18] 機器學習必學庫,支持有監督、無監督多種算法,含文本分析功能
•Orange3[19] 點擊操做的機器學習分析軟件, 可文本分析
•doccano[20] 文本數據標註工具
•label-studio[21] 最牛掰的文本數據標註工具
•matplotlib[22] Python中最萬能繪圖庫,不多有ta畫不出來的圖;但語法較難、靜態圖
•seaborn[23] 基於matplotlib開發的簡化版可視化庫, 通常的圖能夠用ta繪製;高度定製仍須要結合 matplotlib進行樣式定製;靜態圖
•plotnine[24] ggplot2語法的Python可視化庫, 可與plydata[25] 庫結合使用
•pyecharts[26] 國人開發並封裝的動態可視化圖繪製庫; 中文文檔
•plotly[27] 動態可視化圖繪製庫
•bokeh[28] 動態可視化圖繪製庫
•SciencePlots[29] 科研論文繪圖,基於matplotlib
•datapane[30] 數據分析報告生成
•superset[31] 開源商務智能分析可視化庫
•nltk[32] 天然語言分析套件,對中文不友好
•spacy[33] 工業級天然語言模型庫,支持中文
•pattern[34] 天然語言處理、網絡分析、可視化庫
•jieba[35] 中文文本分詞庫
•snownlp[36] 中文情感分析庫
•gensim[37] 最好用、最全的話題模型
•cnsenti[38] 中文情感分析庫(Chinese Sentiment))可對文本進行情緒分析、情感分析。
•label-studio[39] 最牛掰的文本數據標註工具
•doccano[40] 文本數據標註工具
•textstat[41] 文本可讀性計算包(算法全,但僅支持英文)
•texthero[42] 文本預處理、展現、可視化庫,僅支持英文
•tkinter[43] Python內置的gui庫
•PySimpleGUI[44] 最簡單的gui開發庫
•pyqt五、pyside[45] 最牛掰的gui軟件開發庫
•zmail[46] 自動化收發郵件管理庫
•pywinauto[47] Windows電腦自動化Python庫
•WeasyPrint[48] 自動化生產pdf報告
•selenium[49] 瀏覽器自動化框架,能夠自動化點擊瀏覽器,完成某些工做
•mkdocx[50]
•python-docx[51] 建立、修改docx文件庫
•python-ppt[52] 建立、修改ppt文件庫
•openpyxl[53] xlsx文件庫