天然語言處理git
DuReader: a Chinese Machine Reading Comprehension Dataset from Real-world Applicationsgithub
@zhangjun 推薦算法
Machine Reading Comprehension網絡
大型中文閱讀理解數據集,工做來自百度。框架
論文連接dom
https://www.paperweekly.site/papers/1137機器學習
代碼連接學習
https://github.com/baidu/DuReader.net
TransNets - Learning to Transform for Recommendationorm
@ccclyu 推薦
Transfer Learning
引入了遷移學習的隱含表示層來減小 test dataset 的稀疏性。
論文連接
https://www.paperweekly.site/papers/1181
代碼連接
https://github.com/rosecatherinek/TransNets
計算機視覺
Co-attending Free-form Regions and Detections with Multi-modal Multiplicative Feature Embedding for Visual Question Answering
@xiaolu 推薦
Visual Question Answering
視覺問答任務(Viual Question Answering)是最近 2-3 年興起的多模態任務。對於視覺問答任務,算法須要同時理解圖片內容和語言信息,而後推理出正確的答案。目前常見的方法有多模態特徵融合和以及視覺注意力機制。
已有的注意力機制主要有兩類,一類是基於全圖區域的注意力機制,一類是基於檢測框區域的注意力機制,前者容易關注到物體的一部分,後者會缺乏一些檢測框。
本文第一次嘗試將基於全圖區域的與基於檢測框區域的注意力機制融合在一個框架下,充分利用全圖區域和檢測框之間的互補信息;而且提出新的多模態特徵融合方法,將問題特徵、全圖特徵、檢測框特徵進行有效的融合。模型在 VQA 和 COCO-QA 兩個主流數據集上實現了目前最好的結果。
論文連接
https://www.paperweekly.site/papers/1175
代碼連接
https://github.com/lupantech/dual-mfa-vqa
Image Crowd Counting Using Convolutional Neural Network and Markov Random Field
@cornicione 推薦
People Counting
文章融合了 MRF 和 deep 網絡,提出了一種統計靜態圖片中人數的方法。
論文連接
https://www.paperweekly.site/papers/1195
代碼連接
https://github.com/hankong/crowd-counting
機器學習
Social Attention - Modeling Attention in Human Crowds
@zk5580752 推薦
Attention Model
本文是一篇基於 Social LSTM 的後續論文,Social LSTM 是李飛飛團隊於 2016 年提出的行人路徑預測方法。本文則在原文基礎上改進了預測方式,不單單基於 RNN 模型,還引入了 Attention Model,使得預測更加精準和全面。
論文連接
https://www.paperweekly.site/papers/1115
代碼連接
https://github.com/vvanirudh/social-lstm-tf
Breaking the Softmax Bottleneck: A High-Rank RNN Language Model
@paperweekly 推薦
RNN
本文嘗試改進了語言模型在預測 next token 時用 softmax 遇到的計算瓶頸。
論文連接
https://www.paperweekly.site/papers/1112
代碼連接