來源自rnnoise,但非rnn

很快又一年過去了。linux

自學音頻算法也近一年了。算法

不記得有多少個日日夜夜,安全

半夜醒來,就爲驗證算法思路。性能

一次又一次地改進和突破。學習

傻逼樣的堅持,必然獲得牛逼樣的結果。優化

這一年,主要扎音頻算法上。ui

常常有網友聯繫我,幾乎都會問我同一個問題。編碼

我是怎麼學習的?視頻

提及來,其實很簡單。blog

就是先設一個小目標,並且必須是一個具備挑戰性的目標。

例如兩年前從原來作安全,轉去作圖像算法。

當年定的目標就是實現一鍵修圖的算法。

固然,也是作到了。

雖而後來也有改進過屢次,可是一直沒有整理出最後的版本。

有各類各樣的緣由,一直沒時間梳理。

一鍵智能降噪,智能白平衡,智能曝光,同時也兼顧了算法性能。

沒有具體實測,可是實時是確定沒有問題的。

一直有一個心願,就是將這個算法梳理整理,

調優後,合入到視頻播放器中,

打造一個簡單而簡約的視頻播放器。

這個目標也漸漸靠近了,

近期一直在作ffmpeg的編碼轉碼方面的工做。

預計明年吧,也許這個播放器就能夠跟你們見面了。

而今天寫的標題,主要是音頻降噪這個方向。

這個目標也是今年年初給本身定下的目標。

就在昨天 2018.12.1,這個音頻算法,算是初版完成了。

這之中經歷了不少不少,有不少細節。

真的有無數次嘗試和改進優化。

把學習的音頻算法的精髓,運用起來。

最後,達到預期目標。

這裏要稍微說一下,

我是怎麼作的。

其實說簡單也簡單,說難也難。

定了一個目標以後,

確定是去找最傳統的算法資料。

一個一個算法實現。

從中學習到每一個算法的優缺點,缺點固然就要嘗試改進。

優勢就要考慮變通,讓優勢更加突出。

每次都是從一個算法延伸出不少待解決的困難,

而後發現一個問題,就找相關的資料,

嘗試解決,一次又一次攻克問題。

這裏面最重要的一點就是,

必定要堅持每個算法都要本身動手實現一遍。

並且除了編解碼外,不容許調用第三方庫。

純C實現。

這裏有一個我這一年最難啃的點,就是傅里葉變換。

整整花了我2-3個月時間,將全部開源的傅里葉變換看一遍。

從新用c語言實現他們的思路,

最後產出自用的傅里葉變換算法。

這之間獲得過一些朋友的幫助。

固然主要是討論,迸發思路。

最重要的經驗,莫過於,向成功者學習,向業內大牛學習。

不管是開源項目仍是資料論文。

rnnoise這個開源項目,既然能獲得很好的效果,

那就證實有一些算法思路是可行的。

只不過深度學習的方案,

特徵須要依賴數據去訓練。

弊端特別明顯。

不採用深度學習的方法去作,確定能夠。

我一直堅信,只要有一個清晰的頭腦,

不須要依賴數據提取特徵,

理清楚算法的思想,也能達到必定的效果。

就跟作圖像算法同樣,事實證實我是對的。

畢竟曾經作過智能修圖的算法,

有必定的成功經驗。

在作音頻算法的時候,

就少走了很多彎路,

基本上都不用寫代碼就能知道思路的可行性。

若是不是有圖像算法的積累和堅持,

音頻算法,

真的很差啃。

可是,我一直堅信,一切都會落到實處。

千萬不要偷懶,你偷的懶最後仍是要補回來的。

這個社會是很公平的,只有不努力的人才會以爲社會不公平。

固然如今音頻降噪算法還沒達到個人最終要求。

可是做爲一個階段性的成果而言,它已經達到了。

歡迎你們試用,而後給我提需求也好,

提bug也好,我會抽時間好好看看的。

音頻降噪算法 linux示例程序:

https://files.cnblogs.com/files/cpuimage/denoise.zip

我這個降噪算法真的算是集傳統算法優勢,RNN深度學習算法思路於一身。

向rnnoise學了很多思路,致敬!

整個算法實現不到200行,

卻同時擁有高速性能和不錯的效果,

魯棒性極佳,

內存佔用也極低。

而且支持實時幀算法,支持多通道。

由此,你們也能看出來,我在這個算法上花了多少心血。

下層建築搭好了。

之於圖像,之於音頻。

還有不少工做要作,好多方向的問題還沒攻克。

路漫漫其修遠兮。

近三年的殺毒軟件開發經驗,

不到2年圖像算法經驗,

不到1年的音頻算法經驗。

投過一些公司,

看了個人學歷,

近些年的研究方向,

短而雜。

而後就說一句,

學的東西太雜,

經驗不夠,

深度不夠。

人無完人,

確實不想發表太多評論,

我只作我本身。

國內太浮躁了,

歷來沒想過要跟誰去爭什麼。

也不想評論誰好誰壞。

是的,我本人開源的代碼都很垃圾。

那又怎麼樣呢,你有你的評論和觀點。

我有個人生活態度。

有些人翻垃圾桶的習慣真很差。

吃相太醜。

沒那個興趣和精力去作討論和點評,

由於沒有半點實際的意義。

更多的精力用來學習成長和分享。

獨樂了不如衆樂樂。

但願以此結交一些有志之士,一塊兒玩耍。

吹吹水,嘮嘮嗑,打打噸。

巴普諾夫,很忙,很忙。

我還能睡,不要叫醒我。


如有相關問題或者需求能夠郵件聯繫俺探討。

有空回得快一些,沒空可能就.......

郵箱地址是: gaozhihan@vip.qq.com

相關文章
相關標籤/搜索