JavaShuo
欄目
標籤
Spatio-Temporal Fusion based Convolutional Sequence Learning for Lip Reading論文閱讀
時間 2021-01-11
標籤
# CV論文閱讀
简体版
原文
原文鏈接
Abstract 目前最先進的脣讀方法是基於自然機器翻譯和音頻語音識別的seq2seq架構。但是這種方案沒有充分利用脣動的特徵,有兩種缺陷:首先是短期的時間依賴關係是嘴脣圖像到發音嘴型映射的關鍵但是沒有接收足夠的注意力;二是在現有的序列模型中由於使用了全局池化導致局部空間信息的丟失。 本文提出了一個時間聚焦塊來充分描述短期依賴關係,同時提出一個時空融合模塊來保持局部空間信息並降低特徵維度。實驗結果
>>阅读原文<<
相關文章
1.
論文閱讀:《 Lip Reading Sentences in the Wild》
2.
論文閱讀筆記(四十):Learning Spatiotemporal Features with 3D Convolutional Networks(C3D)
3.
Paper Reading - Convolutional Sequence to Sequence Learning ( CoRR 2017 ) ★
4.
【論文閱讀】Convolutional Sequence to Sequence Learning (未完待續)
5.
【論文閱讀筆記】Learning Spatiotemporal Features with 3D Convolutional Networks
6.
Machine Learning & Deep Learning 論文閱讀筆記
7.
Convolutional Sequence to Sequence Learning 論文筆記
8.
論文閱讀筆記《leaning spatiotemporal features with 3D convolutional network》
9.
論文閱讀《Spatiotemporal Multiplier Networks for Video Action Recognition》
10.
論文閱讀——FPGA based Accelerators ofDeep Learning Networks for Learning andClassification:A Review
更多相關文章...
•
RSS 閱讀器
-
RSS 教程
•
PHP 實例 - AJAX RSS 閱讀器
-
PHP教程
•
JDK13 GA發佈:5大特性解讀
•
Scala 中文亂碼解決
相關標籤/搜索
論文閱讀
CV論文閱讀
sequence
fusion
based
spatiotemporal
convolutional
reading
lip
外文閱讀
Thymeleaf 教程
PHP教程
Redis教程
文件系統
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
shell編譯問題
2.
mipsel 編譯問題
3.
添加xml
4.
直方圖均衡化
5.
FL Studio鋼琴卷軸之畫筆工具
6.
中小企業爲什麼要用CRM系統
7.
Github | MelGAN 超快音頻合成源碼開源
8.
VUE生產環境打包build
9.
RVAS(rare variant association study)知識
10.
不看後悔系列!DTS 控制檯入門一本通(附網盤鏈接)
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
論文閱讀:《 Lip Reading Sentences in the Wild》
2.
論文閱讀筆記(四十):Learning Spatiotemporal Features with 3D Convolutional Networks(C3D)
3.
Paper Reading - Convolutional Sequence to Sequence Learning ( CoRR 2017 ) ★
4.
【論文閱讀】Convolutional Sequence to Sequence Learning (未完待續)
5.
【論文閱讀筆記】Learning Spatiotemporal Features with 3D Convolutional Networks
6.
Machine Learning & Deep Learning 論文閱讀筆記
7.
Convolutional Sequence to Sequence Learning 論文筆記
8.
論文閱讀筆記《leaning spatiotemporal features with 3D convolutional network》
9.
論文閱讀《Spatiotemporal Multiplier Networks for Video Action Recognition》
10.
論文閱讀——FPGA based Accelerators ofDeep Learning Networks for Learning andClassification:A Review
>>更多相關文章<<