機器學習資源

教程

今天python


https://github.com/Eurus-Holmes/LIS-YNP 一個包含基礎教程、提升參考資料、有趣實踐項目的 PyTorch 教程。人生苦短,我用 PyTorchgit


http://www.52opencourse.com/49/%E6%96%AF%E5%9D%A6%E7%A6%8F%E5%A4%A7%E5%AD%A6%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86%E5%85%AC%E5%BC%80%E8%AF%BE%E8%AF%BE%E4%BB%B6%E6%B1%87%E6%80%BB 斯坦福nlp的課件github


https://github.com/afshinea/stanford-cs-229-machine-learning/tree/master/zh 機器學習 (CS 229 Stanford) 課件算法


https://github.com/virgili0/Virgilio 本資源庫旨在爲如下領域提供三種有機完整的學習路徑:機器學習、商業智能、雲計算。在此你將可以瞭解相關原理而且在項目實踐中予以運用。若是仔細遵循這些學習路徑,則能夠從零開始構建完整的認識和得到始終可用的技能。事實上,這些學習路徑不須要以前有相關知識,但基礎編程和簡單數學是理解和實踐大多數相關概念的必要條件apache

書籍


http://www.deeplearningbook.org/ 《深度學習》編程


https://github.com/d2l-ai/d2l-zh 《Dive into Deep Learning 》翻譯版,即《動手學深度學習》。服務器

代碼實現


https://github.com/mnielsen/neural-networks-and-deep-learning 《神經網絡與深度學習》相關代碼 Python 實現,神經網絡與深度學習-中文在線閱讀,該書中的相關理論的 Python 代碼實現網絡


https://github.com/taki0112/Tensorflow-Cookbook 易學易用的 Tensorflow 教程架構


https://github.com/ZuzooVn/machine-learning-for-software-engineers 自上而下的學習路線,軟件工程師的機器學習,中文版框架


https://github.com/rushter/MLAlgorithms 常見的機器學習算法,Python 實現:


https://github.com/Tencent/ncnn 騰訊開源的一個爲手機端極致優化的高性能神經網絡前向計算框架


https://github.com/MorvanZhou/tutorials 機器學習入門教程,十分詳細包含視頻教程、文字教程


https://github.com/astorfi/TensorFlow-World 簡單易用的 TensorFlow 教程


https://github.com/vahidk/EffectiveTensorflow TensorFlow 最佳實踐


https://github.com/exacity/deeplearningbook-chinese Deep Learning 中文版


https://github.com/Tencent/angel 騰訊開源的高性能分佈式機器學習平臺,具備普遍的適用性和穩定性,模型維度越高。它將高維度的大模型合理切分到多個參數服務器節點,並經過高效的模型更新接口和運算函數,以及靈活的同步協議,能夠實現各類高效的機器學習算法


https://github.com/ypwhs/captcha_break 使用深度學習來破解 captcha(python 生成驗證碼的庫)驗證碼。該項目會經過 Keras 搭建一個深度卷積神經網絡來識別 captcha 生成的圖片驗證碼,建議使用顯卡來運行該項目。可視化代碼都是在 jupyter notebook 中完成的,若是你但願寫成 python 腳本,稍加修改便可正常運行


https://github.com/apachecn/MachineLearning ApacheCN 製做的《機器學習實戰》。配套視頻:編碼能力強,建議觀看《機器學習實戰 - 教學版》。 編碼能力弱,建議觀看《機器學習實戰 - 討論版》


https://github.com/xitu/tensorflow-docs TensorFlow Docs 是由掘金翻譯計劃實時維護的 TensorFlow 官方文檔中文版,維護者爲全球各大公司開發人員和各著名高校研究者及學生


https://github.com/farzaa/DeepLeague 英雄聯盟的機器學習項目,規模不大,適合研究一些 CV 和 ML 的算法應用


https://github.com/chenyuntc/pytorch-book 書籍《深度學習框架 PyTorch:入門與實踐》的示例代碼,能夠做爲一個獨立的 PyTorch 入門指南和教程。


https://github.com/warmheartli/ChatBotCourse 該項目介紹瞭如何本身動手作聊天機器人。全面地介紹了所須要的技術:天然語言識別、分詞、語料庫、機器學習等,包含所需的 Java 和 Python 代碼


https://github.com/exacity/simplified-deeplearning 《DeepLearningBook》讀書筆記


https://github.com/IBM/elasticsearch-spark-recommender 使用 Apache Spark 的機器學習庫 (MLlib) 來訓練一個協同過濾推薦系統模型 和 Elasticsearch 構建一個推薦系統教程,中文版閱讀


https://github.com/junxiaosong/AlphaZero_Gomoku 使用 TensorFlow/Pytorch/Theano 實現 AlphaZero 算法,經過自我對弈從零訓練五子棋 AI。實現簡單、清晰,適合學習、瞭解 AlphaGo Zero 背後的關鍵思想和技術細節


https://github.com/Avik-Jain/100-Days-Of-ML-Code 《機器學習 100天》中文版


https://github.com/nndl/nndl.github.io 《神經網絡與深度學習》該課程主要介紹神經網絡與深度學習中的基礎知識、主要模型(卷積神經網絡、遞歸神經網絡等)以及在計算機視覺、天然語言處理等領域的應用。在線閱讀


https://github.com/zziz/pwc 深度學習、機器學習論文集合(英文)


https://github.com/josephmisiti/awesome-machine-learning 一個精選的機器學習框架、庫、軟件的集合項目


https://github.com/fastai/fastai 利用當前最好的深度學習算法簡化訓練神經網絡的過程。包含了不少「開箱即用」的工具,支持 Vision、Collab 等模型。示例代碼:


https://github.com/google/deepvariant 一個數據分析工做流。可以使用深度神經網絡從下一代 DNA 序列數據中調用遺傳變異體,聯想到了最近的基因編輯人類事件。關於如何工做的技術細節,以下圖:


https://github.com/VivekPa/AlphaAI 使用無監督學習和監督學習來預測股票,有趣的項目。運行步驟以下:


https://github.com/google-research/bert 一種新的語言表徵模型,來自 Transformer 的雙向編碼器表徵。目前最強 NLP 預訓練模型,橫掃 11 項 NLP 任務記錄


https://github.com/kpzhang93/MTCNN_face_detection_alignment 人臉檢測領域經典之做,出自 2016 年 ECCV 一篇論文。目前在工業應用中落地比較成功,不少公司檢測模塊運用 MTCNN 或者其加速版,MTCNN 將人臉檢測和關鍵點檢測經過一個模型做爲 MultiTasks 的方式進行訓練,inference 時候可同時獲得人臉框信息和關鍵點信息


https://github.com/zeusees/FaceBoxes 出自論文 FaceBoxes: A CPU Real-time Face Detector with High Accuracy,是一種能夠在 CPU 上實現實時檢測的方法,並且精度不錯。該項目是 Caffe 版本,步驟講解清晰,能夠快速復現。鑑於 FaceBoxes 的檢測速度很是快,也能夠做爲一種生產落地的方法,而且現有速度仍有必定的優化空間


https://github.com/mahyarnajibi/SSH 該項目是 ICCV2017 論文 SSH:Single Stage Headless Face Detector 做者本身開源的項目,算是官方開源項目,具備必定的權威性。SSH 也算是人臉檢測中一個經典的方法,具備較高的精度和較快的速度。項目實現了論文中的不少細節,對復現過程也有詳細的講解,容易實現。美中不足的是論文中的 Pyramid 方式,該項目沒有實現

大專欄   機器學習資源>

https://github.com/yxlijun/S3FD.pytorch 該項目是論文 S3FD:Single Shot Scale-invariant Face Detector 的 pytorch 復現版本。S3FD 目前在 FDDB 的評測中排在前幾位,屬於精度較高的人臉檢測方法。論文主要解決人臉尺度問題,進一步提高對小臉的檢測


https://github.com/SnailTyan/deep-learning-papers-translation 主要內容是 CV 領域裏一些論文的翻譯,包括分類、檢測、OCR和模型輕量化。不喜歡看英文原版論文的,能夠關注該項目


https://github.com/openai/spinningup (英文)OpenAI 製做的教育資源,能夠更容易地學習深層強化學習。官方項目,淺顯易懂,提供練手的例子,方便初學者或對深層強化學習感興趣的人羣學習和入門


https://github.com/hindupuravinash/the-gan-zoo 生成對抗網絡(Generative Adversarial Networks,簡稱GAN)的一個大集合,做者列舉了生成對抗網絡領域各式各樣的應用集合,大部分爲論文,包含少數的 GitHub 項目。該項目對於 GAN 領域覆蓋面全面,論文列表整理清晰,GAN 方向的研究者能夠從這個項目中查詢到想看的經典的論文或者擴充本身的知識儲備


https://github.com/huggingface/pytorch-pretrained-BERT Google 神級語言表示模型的 PyTorch 預訓練模型和 PyTorch 框架結合,使得更加容易上手。PyTorch 版本更方便小白上手實驗。示例代碼:


https://github.com/daicoolb/RecommenderSystem-Paper 推薦系統論文整理列表,包括了行業頂尖會議 AAAI、NIPS 等發表的論文,以及 KDD 一些獲獎論文。方便推薦系統方向以及文本表示方向等研究人員,跟蹤閱讀行業內經典論文和最新研究方向


https://github.com/GeorgeSeif/Semantic-Segmentation-Suite 圖像語義分割模型組件整理,包含了模型、數據增廣、準確率評價等模塊。方便研究者快速搭建和試驗一個圖像語義分割模型,同時集成了一些 state-of-the-art 的模型


https://github.com/openai/gpt-2 OpenAI 發佈的 15 億參數量通用語言模型 GPT-2,迄今最大模型!展現了一種構建語言處理系統的潛在方式,即根據天然發生的演示學習執行任務。實例代碼:


https://github.com/kmario23/deep-learning-drizzle 世界計算機名校的深度學習、強化學習、機器學習、計算機視覺、天然語言處理等方面的公開課


https://github.com/stanfordnlp/stanfordnlp 適用於多種人類語言的 Stanford NLP 官方 Python 庫。包含用於運行 CoNLL 2018 共享任務的最新徹底神經管道以及訪問 Java Stanford CoreNLP 服務器的軟件包。實例代碼:


https://github.com/taki0112/Tensorflow-Cookbook 易學易用的 Tensorflow 教程


https://github.com/ajbrock/BigGAN-PyTorch 「Bye Bye TPU」,4 個 GPU 就能訓練「史上最強」 BigGAN!只需 4-8 個 GPU 便可訓練,擺脫了算力束縛


https://github.com/clone95/Virgilio 本資源庫旨在爲如下領域提供三種有機完整的學習路徑:機器學習、商業智能、雲計算。在此你將可以瞭解相關原理而且在項目實踐中予以運用。若是仔細遵循這些學習路徑,則能夠從零開始構建完整的認識和得到始終可用的技能。事實上,這些學習路徑不須要以前有相關知識,但基礎編程和簡單數學是理解和實踐大多數相關概念的必要條件


https://github.com/vietnguyen91/QuickDraw 谷歌開發的一個流行的在線遊戲,神經網絡會猜想你在畫什麼。神經網絡從每幅圖畫中學習,提升正確猜想塗鴉內容的能力。如今你能夠基於這個倉庫,用 Python 構建本身的 Quick Draw 遊戲


https://github.com/thunlp/GNNPapers 自從卷積神級網絡面世以來,大部分人將其應用在規則的空間結構數據當中,好比圖像。可是現實中存在更多的並不具有規則的空間結構的數據,所以研究人員提出了處理這部分數據的網絡模型-GNN。該項目列舉了 GNN 方面的論文,較爲全面,適合有必定基礎的人閱讀


https://github.com/deepfakes/faceswap 這個工具能夠對圖片和視頻進行換臉。能夠很方便地處理圖片和視頻,搞些有意思的事情


https://github.com/CMU-Perceptual-Computing-Lab/openpose 基於卷積神經網絡和監督學習的開源庫,能夠實現人的面部、軀幹和四肢甚至手指的跟蹤。適用於多人,且標記準確,同時具備較好的魯棒性


https://github.com/TencentYoutuResearch/FaceDetection-DSFD 騰訊優圖的雙分支人臉檢測器全新算法,該算法已經被計算機視覺頂級會議 CVPR 2019 接收。優圖這次提出的 DSFD 人臉檢測算法,主要有 3 點創新:


https://github.com/NVlabs/SPADE 英偉達(NVIDIA)新開源的繪圖工具。利用生成對抗網絡,根據幾根簡單的線條就能生成栩栩如生的圖像


https://github.com/hzwer/LearningToPaint 一個深度強化學習項目,研究如何讓機器用畫筆畫畫。也可體驗製做本身的繪畫或根據一張圖片生成一整個繪畫過程


https://github.com/bentoml/bentoml 一個機器學習工具用來打包和發佈模型。幫助數據科學家用不到 5 分鐘把在 ipython notebook 裏的模型發佈到生產環境


https://github.com/afshinea/stanford-cs-229-machine-learning 斯坦福 CS229 教程講義文檔,該文檔內容細緻、條理清晰,方便入門者做爲讀書筆記學習。中文版


https://github.com/Yorko/mlcourse.ai 一套機器學習課程。課程全面細緻,同時帶有 demo 以及進階的 Kaggle 比賽的樣例,很是適合初學者逐步的深刻學習


https://github.com/fengdu78/lihang-code 機器學習領域經典書籍《統計學習方法》的課件和代碼。這個項目提供了課件、代碼資源,敘述從具體問題或實例入手,由淺入深,闡明思路,給出必要的數學推導,便於讀者掌握統計學習方法的實質,學會運用


https://github.com/facebookresearch/maskrcnn-benchmark Facebook 開源的 PyTorch 版本的 Mask-RCNN。研究人員能夠按照教程、示例代碼逐步進行實現


https://github.com/Jiakui/awesome-bert 與 bert 相關的 nlp 論文、應用、資源集合。緊跟天然語言處理髮展前沿,便於加速開展相關研究工做


https://github.com/itisyang/ImageMiniLab 圖像迷你實驗室,可進行圖像實驗、處理、分析。使用 PyQt5 結合 opencv-python 實現代碼簡潔易讀,經過該工具能夠快速演示圖像算法效果,便於 cv 入門學習


https://github.com/PetrochukM/PyTorch-NLP 簡稱 torchnlp 是一個支持快速原型設計(包括數據集和神經網絡層)的 PyTorch-NLP 工具包。該庫封裝好了神經網絡層、文本處理模塊和數據集庫,有利於加速天然語言處理研究和實踐。示例代碼:


https://github.com/zihangdai/xlnet CMU 全新 XLNet 預訓練模型。BERT 帶來的影響還未平復,CMU 與谷歌大腦提出的 XLNet 在 20 個任務上的表現超過了 BERT,並在 18 個任務上取得了當前最佳效果。使人激動的是目前 XLNet 已經開放了訓練代碼和大型預訓練模型,這回又有的玩了


https://github.com/rasbt/deeplearning-models 各類深度學習架構、模型和技巧的集合。TensorFlow 和 PyTorch 的各類深度學習架構、模型和技巧的 Jupyter 集合,很是適合學習


https://github.com/paddlepaddle/paddle 一個簡單易用、高效靈活、可擴展的深度學習平臺,由百度科學家和工程師共同開發

相關文章
相關標籤/搜索