6月份最熱門的機器學習開源項目Top10

編譯 | Debra
編輯 | Natalie
AI 前線導讀: 燥熱的 6 月天已經結束了,本月機器學習領域又有哪些開源項目值得一看呢?Mybridge AI 從將近 250 個機器學習開源項目中評選出排名 Top10 的項目。這是他們對在此期間新發布或進行重大發布的項目進行比較以後得出的結果,考量了各類因素對項目的專業性進行排序。哪些項目上榜了呢?

更多優質內容請關注微信公衆號「AI 前線」(ID:ai-front)


  • Github 收藏平均數量:764⭐️html

  • 機器學習 Github Top10 開放源代碼,https://github.com/Mybridge/machine-learning-open-source。git

  • 主題:NLP 架構、視頻分類、Mlflow、經典遊戲、Dragonfire、Opencv、計算機視覺、Star GAN、Glow、生成壓縮程序員

這些開源項目對程序員頗有用,但願你能找到一個能引發你興趣的有趣項目。github

Top1 Nlp-architect

英特爾人工智能實驗室的 NLP 架構:探索最早進的 NLP 深度學習拓撲和技術的 Python 庫[Github 1194 顆星]算法

當前版本的 NLP Architect 包含了從研究角度和實際應用都很是有趣的特性:數據庫

  • NLP 核心模型能夠爲 NLP 工做流程提供強大的語言特徵提取功能:例如分析器(BIST)和 NP chunker編程

  • 提供一流性能的 NLU 模塊:例如意圖提取(IE),名稱實體識別(NER)後端

  • 解決語義理解的模塊:例如,內涵提取,最多見詞義,NP 嵌入表示(如 NP2V)微信

  • 會話式 AI 組件:例如 ChatBot 應用程序,包括對話系統,序列分塊和 IE網絡

  • 使用新拓撲的端到端 DL 應用程序:例如 Q&A,機器閱讀理解

感謝 Intel Nervana[英特爾人工智能實驗室對 NLP 架構的介紹:

https://ai.intel.com/introducing-nlp-architect-by-intel-ai-lab/

github 連接:

https://github.com/NervanaSystems/nlp-architect

Top2 視頻非局域網

Video-nonlocal-net:用於視頻分類的非局部神經網絡,用 Caffe2 開發[Github 592 顆星]

Facebook Research 介紹:https://medium.com/@FBResearch

論文地址:https://arxiv.org/pdf/1711.07971.pdf

GitHub 連接:

https://github.com/facebookresearch/video-nonlocal-net

Top3 Mlflow

整個機器學習生命週期的開源平臺 [Github 1282 顆星]

目前的 MLflow 是 alpha 版本,意味着 API 和數據格式有可能發生變化,且不支持 Windows 運行。

GitHub 連接:

https://github.com/databricks/mlflow

Top4 Gym Retro

經典遊戲強化學習平臺 [Github 905 顆星]

OpenAI 使用 Gym Retro 來研究強化學習(RL)算法並研究泛化。 RL 以前的研究主要集中在優化代理解決單個任務上。 經過 Gym Retro,咱們能夠研究在概念類似但外觀不一樣的遊戲之間進行歸納的能力。此外,OpenAI 還微信遊戲田姐了新的整合工具。

視頻地址:https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/retro-heavy/output2.mp4

此版本包括世嘉創世紀和世嘉主系統的遊戲,以及任天堂的 NES,SNES 和 Game Boy 遊戲機。它還包括對世嘉 Game Gear,任天堂 Game Boy Color,任天堂 Game Boy Advance 和 NEC TurboGrafx 的初步支持。 一些已發佈的遊戲集成(包括 Gym Retro 的數據 / 實驗文件夾中的那些遊戲)處於測試狀態。因爲涉及的變化規模很大,代碼暫時只能在一部分遊戲上使用。

OpenAI 介紹:https://blog.openai.com/gym-retro/

GitHub 連接:

https://github.com/openai/retro/tree/develop

Top5 Dragonfire v1.0

基於 Ubuntu 的 Linux 發行版的開源 AI 助手 [Github 688 顆星]

支持環境:

Dragonfire 執行命令步驟:

  • 搜索內置命令並評估代數表達式

  • 嘗試學習使用高級 NLP 和數據庫管理技術

  • 詢問無所不知的 Q&A 引擎(感謝全部爲維基百科作貢獻的人)

  • 使用 Deep Conversation 系統進行響應,這是一個使用 Cornell Movie-Dialogs Corpus 訓練的 seq2seq 神經網絡

Dragonfire 使用 Mozilla DeepSpeech 來理解你的語音命令,並使用 Festival Speech Synthesis System 來處理文本到語音的任務。

你能夠到 Gitter 聊天室(https://gitter.im/DragonComputer/Lobby),或者 Twitter 賬戶與 Dragonfire 體驗親自與她交談的樂趣。

DRAGON.COMPUTER 介紹:

https://github.com/DragonComputer/Dragonfire

GitHub 連接:

https://github.com/DragonComputer/Dragonfire

Top6 FaceAI

人臉、視頻、文字檢測和識別項目(使用自動翻譯器:中文 - >英文) [Github 1482 顆星]。

功能

  1. 人臉檢測、識別(圖片、視頻)

  2. 輪廓標識

  3. 頭像合成(給人戴帽子)

  4. 數字化妝(畫口紅、眉毛、眼睛等)

  5. 性別識別

  6. 表情識別(生氣、厭惡、恐懼、開心、難過、驚喜、平靜等七種情緒)

  7. 視頻對象提取

  8. 圖片修復(可用於水印去除)

  9. 圖片自動上色

  10. 眼動追蹤(待完善)

  11. 換臉(待完善)

開發環境

  • Windows 10(x64)

  • Python 3.6.4

  • OpenCV 3.4.1

  • Dlib 19.8.1

  • face_recognition 1.2.2

  • keras 2.1.6

  • tensorflow 1.8.0

  • Tesseract OCR 4.0.0-beta.1

GitHub 連接:

https://github.com/vipstone/faceai

Top7 Sod

嵌入式計算機視覺和機器學習庫(CPU 優化和 IoT 功能)[Github 557 顆星]

SOD 是嵌入式的現代跨平臺計算機視覺和機器學習軟件庫,公開了一套用於深刻學習的高級媒體分析和處理 API,包括實時、多類別對象檢測和嵌入式系統上的模型訓練計算資源和物聯網設備,旨在爲計算機視覺應用提供通用基礎設施,並加速在開源和商業產品中使用機器感知。

SOD 目前的計算機視覺算法支持但不限於移動機器人、AR/VR、基因學、人機交互、機器自動化等。

值得注意的 SOD 功能:

  • 專爲真實世界和實時應用程序而打造。

  • 最早進的 CPU 優化深度神經網絡,包括全新的獨家 RealNets 架構。

  • 無需專利,先進的計算機視覺算法。

  • 支持主要的圖像格式。

  • 簡單,乾淨且易於使用的 API。

  • 深刻了解有限的計算資源,嵌入式系統和物聯網設備。

  • 易於使用 OpenCV 或任何其餘專有 API 進行插補。

  • 預訓練模型可用於大多數體系結構。

  • 支持 CPU 的 RealNets 模型訓練。

  • 已完備、跨平臺、高質量的源代碼。

  • SOD 是免費的,用 C 語言編寫,幾乎能夠在全部平臺和體系結構上編譯和運行。合併 - 將全部 SOD 源文件合併爲一個 C 文件(sod.c)以便於部署。

  • 開源,積極開發和維護產品。

  • 開發者友好的支持渠道(https://sod.pixlab.io/support.html)

SOD 編程指南:https://sod.pixlab.io/intro.html

Symisc Systems 主頁介紹:https://sod.pixlab.io/

GitHub 連接:https://github.com/symisc/sod

Top8 StarGAN-Tensorflow

StarGAN 的簡單 Tensorflow 實現(CVPR 2018 Oral)[Github 382 顆星],感謝 Junho Kim。

StarGAN 是一個使用單個數據集解決多域圖像到圖像轉換問題的框架,能夠合併包含不一樣標籤集的多個數據集,並靈活地使用這些標籤進行圖像翻譯。

論文連接:https://arxiv.org/pdf/1711.09020.pdf

GitHub 連接:

https://github.com/taki0112/StarGAN-Tensorflow

Top9 Glow

神經網絡硬件加速器編譯器 [Github 603 顆星],致謝 PyTorch。

Glow 是針對各類硬件目標而設計的機器學習編譯器和執行引擎,被用做高級機器學習框架的後端。該編譯器能夠進行最早進的編譯器優化和神經網絡圖的代碼生成。這個庫還在實驗和發展階段。

工做原理

Glow 將傳統的神經網絡數據流圖下降到兩階段強類型中間表示(IR)。高級 IR 容許優化器執行特定域的優化。較低級別的僅基於指令的 IR 容許編譯器執行與內存相關的優化,例如指令調度,靜態內存分配和複製消除。在最底層,優化器執行特定機器代碼生成,以利用其硬件特性。Glow 的下降階段特色在於使編譯器無需在全部目標上實現全部運算符,從而支持大量的輸入運算符以及大量的硬件目標。下降階段的設計旨在減小輸入空間,讓新的硬件後端專一於少數線性代數基元。其設計理念在 arXiv 論文中有所描述。

論文連接:https://arxiv.org/abs/1805.00907

GitHub 連接:

https://github.com/pytorch/glow

Top10 生成壓縮

Generative-compression:GAN 極端學習圖像壓縮的 TensorFlow 實現。[Github 225 顆星],致謝 Justin-Tan。

Generative-compression 的方法由 Agustsson 等人在 Generative Adversarial Networks for Extreme Learned Image Compression 一文中提出。

論文連接:https://arxiv.org/pdf/1804.02958.pdf

GitHub 地址:

https://github.com/Justin-Tan/generative-compression

原文連接:

https://medium.mybridge.co/machine-learning-open-source-projects-of-the-month-v-june-2018-d87e2ca3e13f  

相關文章
相關標籤/搜索