拍樂雲創始人趙加雨:沉浸式音視頻加持數智化將來世界

本文由 拍樂雲創始人兼CEO趙加雨 撰寫並投遞參與由數據猿&上海大數據聯盟聯合推出的「行業盤點季之數智化轉型升級」大型主題策劃活動之《2021中國企業數智化轉型升級先鋒人物》榜單/獎項的評選。程序員

數據智能產業創新服務媒體算法

——聚焦數智 · 改變商業markdown

做爲拍樂雲的創始人及音視頻行業從業者,我從音視頻行業的角度來分享咱們對於數智化的觀察和從業感覺。2019年末開始的疫情給各行各業都帶來了深遠影響,其中比較大的一個變化是各行各業的線上化,疫情強迫人們把工做、學習、生活、娛樂等都搬到了線上,而這個影響不會由於疫情的緩解而減小,各行各業的線上化將會成爲長期的趨勢。(數據猿曾對外發布#榜樣的力量#《新冠戰「疫」——中國數據智能產業最具社會責任感企業》榜單網絡

音視頻的「達克效應」曲線架構

「達克效應」描述的是一種心理學現象,一般新技術的出現和應用也符合達克效應曲線,即技術剛出現時會引來很是高的關注度和熱度,此爲愚昧之巔,可是過一段時間後可能由於達不到大規模商用的成熟度,或者沒有找到應用場景等,致使進入絕望之谷,那麼接下來隨着技術更加成熟,會進入開悟之坡,最終會取得比愚昧之巔時更大的應用。oop

音視頻並不算新技術,但隨着網絡、設備、各類新技術的發展,音視頻技術也隨之不斷髮展,在疫情以前,音視頻互動通常只應用在視頻會議、在線娛樂交友、在線教育等少數場景,疫情使得音視頻技術迅速出圈,在各類場景下得到了普遍應用。過去兩年的音視頻技術也很符合「達克效應」曲線,能夠說,疫情讓音視頻短期內進入了愚昧之巔,各行各業都進入了線上化,而線上化離不開音視頻技術。隨着疫情趨於穩定,音視頻的用量和使用場景大幅下跌,貌似進入了絕望之谷,可是疫情給生產端和消費端都形成了不少不可逆的改變,將來音視頻必定會在更廣的行業和場景裏應用起來,即進入開悟之坡,最終的用量必定會超過疫情期間。學習

音視頻賦能下的行業線上化大數據

音視頻技術的門檻高,涉及到的技術棧長,須要的專業人才多,所以須要第三方雲廠商提供音視頻解決方案。拍樂雲做爲一家提供實時音視頻PaaS雲服務的公司,在過去兩年裏服務了各類行業和線上化場景,也親身感覺到了其中的發展和變化。這裏和你們分享一下咱們看到的一些變化。(拍樂雲曾以《視頻矯正技術——基於參數估計的自由幾何變換算法》榮獲《數據猿·金猿榜年度榜單——2020大數據產業創新技術突破》)優化

疫情後咱們看到了一個明顯的趨勢:音視頻通信成爲大衆溝通分享的重要方式。企業會議、遠程授課、醫生會診、社交播客等場景愈來愈多,將來這類功能性實時場景將以更成熟的內容、更豐富的形式出現,而支撐這些場景的正是背後的直播和音視頻技術。編碼

娛樂行業做爲線上化的先行者,一直熱度不減,疫情讓人們居家娛樂的需求快速爆增。一塊兒聽/一塊兒看、視頻社交、秀場直播、語聊房、在線KTV等等娛樂社交APP不斷推陳出新,知足人們多元化線上娛樂的需求。這意味着音視頻廠商不只要保證優異穩定的音視頻質量,還須要不斷迭代底層技術以支持產品形態的持續創新。

咱們看到疫情讓教育的線上化獲得了大規模的實踐,雖然學科教育正面臨政策的監管,但線上化的需求不會少,線上化的趨勢也不會變。教育的線上化在必定程度上解決了資源不均衡的問題,而技術的升級解決的是線上教學的效果和效率的問題,讓老師和學生能像線下面授同樣身臨其境,隨時答疑、激勵,甚至還能夠像線下班課同樣,有小組討論和PK互動。

金融行業的線上化轉型近年來也是發展迅速,出現了遠程銀行、視頻客服、金融雙錄等各類線上化的業務場景。爲了解決線上線下業務辦理「零差異」,內部協同運營更高效的問題,音視頻廠商也在不斷地創新技術並深刻場景痛點,爲金融行業發展持續賦能。

物聯網行業也在快速發展,萬物互聯,音視頻技術成爲必不可少的推進力,電話手錶、陪護機器人、智慧車載、智慧家居、智慧安防、智慧工業等場景中都須要深度結合音視頻技術,鏈接人與人、人與物。爲了更好地適配不一樣的硬件終端,咱們深度優化了音視頻編碼算法和引擎,適應各類低功耗、低內存等極限環境下的音視頻通訊。

咱們還看到了政企行業在數字化、線上化轉型中的決心和能力。在政策的推進下,我國信創產業發展迅速,成爲了推進經濟發展的「新基建」。做爲音視頻技術廠商,咱們全力支持國產化,與麒麟軟件完成兼容性認證,全面適配鴻蒙系統,爲政企行業的數字化、線上化轉型打造發展引擎。

沉浸式音視頻加持數智化將來

音視頻技術會隨着AI、5G、AR/VR等技術的發展而發展,將會給用戶帶來更加沉浸式的體驗,也將催生更多行業和場景來應用音視頻技術。

AI技術對整個RTC行業帶來的影響是很是深遠的,客觀地說,以深度學習爲表明的AI技術的發展與成熟,對音視頻關鍵技術的突破提供了另外一個有但願的方向。有些使用傳統技術沒法解決的問題,能夠經過與AI技術的融合,大大下降問題解決的難度。不管是RTC行業的核心音視頻編解碼,仍是其餘一些音視頻處理和加強技術,好比如今比較熱的音頻降噪、視頻超分、對象分割識別、語義識別等,在AI的加持下,都得到了突破,從而催生了智能客服、智能監控、虛擬形象等新領域。

5G浪潮的爆發正在爲實時音視頻創造低時延和高帶寬的網絡條件,這些基礎設施的改進,爲超高清視頻、VR和全景視頻技術的落地創造了可能, 這些技術將會給用戶帶來「身臨其境」的沉浸式體驗。你們必定有聽過 Metaverse 元宇宙概念,它是 Meta+Verse 的組合,被定義爲全新的「將來互聯網形態」。而實時音視頻技術在其中的應用,纔剛剛開始,它會打破虛擬和現實的邊界,將人與人之間的距離不斷拉進,打造一個全新的數智化將來世界。

做者我的簡介

趙加雨,拍樂雲創始人兼CEO,音視頻技術專家,資深程序員,足球愛好者,崇尚極簡主義,簡單就是生產力。東南大學計算機系畢業,從事實時音視頻領域技術18年,精通音視頻總體架構和技術。曾任Cisco Webex 美國架構師、網易雲信 CTO等職,在14年外企氛圍的薰陶後,2017年尋求改變,離開美國回國加入互聯網雲服務浪潮。2019年創立了國內第一家視頻會議背景的實時音視頻 PaaS 雲服務公司拍樂雲,深耕技術創新、場景研究和行業洞察,致力於爲企業和開發者提供更好的實時音視頻、互動白板、互動直播等產品,構建雲上的每一次美好互動。

相關文章
相關標籤/搜索