當咱們想要在不知道最終數據庫表長什麼樣的狀況下,快速收集數據並保存到數據庫中的時候,Dataset 庫將是咱們的最佳選擇。Dataset 庫有一個簡單但功能強大的 API,所以咱們能夠很容易的把數據保存下來,以後再進行整理。python
Dataset 創建在 SQLAlchemy 之上,因此若是須要對它進行擴展,你會感到很是熟悉。使用 Django 內建的 inspectdb 管理命令能夠很容易地把底層數據庫模型導入 Django 中,這使得和現有數據庫一同工做不會出現任何障礙。git
Beautiful Soup(通常寫做 BS4)庫使得從 HTML 網頁中提取信息變得很是簡單。當咱們須要把非結構化或弱結構化的 HTML 轉換爲結構化數據的時候,就須要使用 Beautiful Soup 。用它來處理 XML 數據也是一個很好的選擇,不然 XML 的可讀性或許會不好。github
當須要和 HTTP 內容打交道的時候,Requests 毫無疑問是最好的標準庫。當咱們想要抓取 HTML 網頁或鏈接 API 的時候,都離不開 Requests 庫。同時,它也有很好的文檔。數據庫
當須要寫一個簡單的 Python 腳本做爲命令行工具的時候,Click 是我最喜歡用的庫。它的 API 很是直觀,而且在實現時通過了深思熟慮,咱們只須要記住不多的幾個模式。它的文檔也很優秀,這使得學習其高級特性更加容易。django
衆所周知,命名是一件困難的事情。Python Slugify 是一個很是有用的庫,它能夠把一個標題或描述轉成一個帶有特性的惟一標識符。若是你正在作一個 Web 項目,而且你想要使用對搜索引擎優化友好SEO-friendly的連接,那麼,使用 Python Slugify 可讓這件事變得很容易。網絡
Pluggy 庫相對較新,可是若是你想添加一個插件系統到現有應用中,那麼使用 Pluggy 是最好也是最簡單的方式。若是你使用過 pytest,那麼實際上至關於已經使用過 Pluggy 了,雖然你還不知道它。工具
DataSette 是一個神奇的工具,它能夠很容易地把 CSV 文件轉換爲全特性的只讀 REST JSON API,同時,不要把它和 Dataset 庫混淆。Datasette 有許多特性,包括建立圖表和 geo(用於建立交互式地圖),而且很容易經過容器或第三方網絡主機進行部署。學習
若是你不想在源代碼中保存 API 密鑰、數據庫憑證或其餘敏感信息,那麼你便須要解析環境變量,這時候 envparse 是最好的選擇。Envparse 可以處理環境變量、ENV 文件、變量類型,甚至還能夠進行預處理和後處理(例如,你想要確保變量名老是大寫或小寫的)。優化
有什麼你最喜歡的用於業餘項目的 Python 庫不在這個列表中嗎?歡迎在評論中和咱們一塊兒分享一塊兒學習。 更多Python技術文章請關注2019年,Python技術持續更新(附教程)搜索引擎