浪潮之巔,程序員如何擁抱新技術?

回想從前,AI、雲計算、5G……幾年前還以爲遙遠的技術,在快速發展之中,有了落地方案,慢慢成爲了新的基礎設施。展望將來,自動駕駛、邊緣計算、量子計算……這些新技術又將會帶來怎樣的變革?本文是對騰訊量子實驗室專家研究員郝少剛、PreAngel合夥人 & 騰訊雲最具價值專家(TVP)李卓桓、青寧信安科技聯合創始人 & 騰訊雲最具價值專家(TVP)白慧冬(筆名青潤)三位老師在「雲+社區沙龍online」的分享整理,但願與你們一同交流。

點擊視頻,查看完整直播回放html

01 技術開拓者們的成長故事

青潤:我接觸計算機最先的是 86 年,那個時候仍是小學,就從 basic 開始學起,我本科學的是材料加工工程,畢業後又在中科院待了一年多,隨後出來轉行當程序員,算得上是中國最先一批職業軟件工程師。實際上在 98 ~99 年以前,中國是沒有軟件工程師的,那個時候都是個體的程序員爲主。git

在這個行業幹了幾年以後, 05 年我離開中國電信又回到中科院,開始作人臉識別和行爲分析,從事如今你們常常提到的人工智能的一些基礎科研工做。後來開始出來創業,第一次創業失敗以後,去中國教育電視臺待了幾年,再次出來的時候本身發明了一個新的技術點,解決了一個基於能源再分配的節能方案,而後就有了我如今的公司。程序員

咱們如今在作畜牧業、動物保護等與動物相關的技術,其中一個技術方向可能聽起來有點玄幻,可是這個方向咱們認爲是能夠實現的,稱之爲跨物種語言互通技術。這個技術仍在延續中,目前還只是初始階段,相信未來會有更多的人加入到這個領域。github

郝少剛:個人名字是郝少剛,我是 06 年在清華物理系畢業,而後到了美國能源部國家實驗室作科研工做,後來又轉戰工業界,首先在半導體光刻機公司 ASML 工做了幾年,後來又到谷歌工做了幾年,去年加入了騰訊量子實驗室,如今在作一些跟量子計算相關的工做。咱們作的工做有偏科研的部分,也有在騰訊雲上作一些應用架構方面的落地工做。算法

我是從學術界跨界到工業界的,因此對新技術是很是感興趣的,甚至是一些如今看似很無厘頭的好比生物類、半導體之類的新技術,我都充滿着濃厚的興趣。整個行業從科研的內核到硬件、半導體這一層,接着是外面的軟件層面我都有從事過,我也幫金融領域的朋友寫過一些自動化交易的算法,總之就是作的和接觸到的東西比較「雜」。 數據庫

李卓桓:先介紹一下我本身的工做,其實我在過去 10 年裏一直是在作早期天使基金的投資工做,因此我如今的身份是一個投資人。咱們過去 10 年在整個移動互聯網、人工智能等方向進行投資。我工做的基金叫 PreAngel 是一個很早期的小基金,咱們投過了大概幾百個早期的移動互聯網初創項目,還有一些其餘的技術,好比區塊鏈和我最近關注的人工智能,尤爲是 NLP 對話,關於如何用計算機智能來替代掉人的一些重複性工做。 編程

我自己是一個熱衷新技術的技術愛好者,如今我在投資以外,在 Github 上面也有一個特別大的開源項目叫 Wechaty,如今已經有接近 1 萬個 star 了,被不少開發者用來專門作各類各樣的聊天機器人,因此你們若是感興趣的話,歡迎去看看或者和我交流聊天機器人方面的技術。安全

Git地址:https://github.com/wechaty/wechaty 服務器

其實我也有30年的代碼經驗,能夠稱得上是一名資深程序員。我在初中的時候就經過你們熟知的小霸王學習機自學了 basic ,而後在高中的時候自學了 C 和 C++ 等,後來 97 年到清華讀書的時候,由於清華的網絡很好就有幸參與到了第一輪互聯網浪潮中來。當時中國第一個知名的門戶是 ChinaRen,後來被搜狐收購了,我在裏面作網絡工程師。在第二輪互聯網浪潮到來的時候,我又最先加入到優酷網,在優酷網負責全部的技術團隊的組建,還有開發運維,我當時職位是首席科學家,專門負責全部的技術。微信

以後我本身出來創業,作了國內比較早的相似 Twitter 的網站 嘰歪,後來這個項目並無作下去。在 2010年以後我開始基於我以前對技術的理解,還有在投資界的朋友與創業者的關係,集中精力去幫助早期的技術方向創業者,在公司早期創立的過程當中,經過天使投資的方式幫助到他們。

在最先期互聯網時期, HTML 和 JacaScript 大行其道的時代,在 Web 1.0 和 2.0 尚未普及開 CSS 的時期,乃至到後來 08 年開始的移動互聯網時代,再到如今的人工智能領域,深度算法、 AI 模型上,我都傾注了不少的時間在研究這些新技術,因此我絕對是一個鐵桿的技術愛好者。

02 大咖們眼中的新技術

郝少剛::由於我接觸的領域比較雜,一開始在搞科研的時候,主要是作一些並行計算的工做,因此那時候主要是用 Fortran 在寫一些東西。因此當接觸C++ 這些面向對象的概念的時候,我以爲是比較新穎的。後來轉戰到工業界,特別是軟件行業每隔幾年就會有一個新的語言或者新的一套框架出來,我就想:面對這些層出不窮的技術,咱們該怎麼樣去追?

個人一個體會就是從最核心的基礎科學,到外面的硬件半導體層,再到軟件應用層面,和更外層如金融領域中的應用,越往內層的創新對時間跨度的控制就會越長,越外層的那些技術創新對時間的控制可能就會比較短,迭代的速度也會更快一些

這多是一種天然規律,越到內部它是有一些天然界規律支配的趨勢,好比說量子力學如今都發展 100 多年了,可是人們如今纔剛剛開始作量子計算機沒多少年,因此前面的路還很長。半導體從上世紀四五十年代開始,你們作硅基半導體晶體管到如今再往前至少還能看到十到二十年的持續,因此這跨度也很長。

可是到了軟件這個層面,可能幾年間就會有一個新的框架或者新的語言出來,好比金融領域更是會不停的產生這樣那樣的投資組合來規避風險,可能很快就會有一個新的策略出現,因此技術迭代的時間尺度在不一樣的層面上跨度是不太同樣的,這是我對新技術的一點體會。

李卓桓:少剛,我這裏有一個問題想問你:做爲一名量子領域的專家,在過去很長一段時間裏,硬件的摩爾定律都一直有效,硬件的性能增加也很是快,但最近咱們發現 CPU 速度開始漸漸跟不上了,這無疑會對將來產生很大的影響,甚至很多人開始對硬件的性能產生了一些悲觀,不知道你怎麼看待這一點?

郝少剛:對的,這裏確定是會到達一個極限的。我以前待過的半導體公司 ASML 是一個光刻機設備公司,咱們作的是一些並行計算的模擬,如今像臺積電還有三星已經能夠量產 7 納米的芯片了,甚至如今 5 納米的芯片都已經有了。摩爾定律是每 18 個月晶體管的密度要翻一番,因此 5 納米下一代就是 3 納米,再往下多是 2 納米等等。

光刻技術咱們能夠假定它就像版畫同樣,作版畫多是先刻一個板,而後套在一個紙上,再刷上相應的顏色,就獲得了你的畫。最重要的瓶頸在什麼地方呢?在於你要刻多種顏色的時候要套色,而後下一次又拿另一層放上來作對齊的時候,發現對不齊了,它的極限就在 2 納米這個地方,這是它的一個極限。

因此到 2 納米如下芯片的良率就會下降,那麼你的成本天然就提升了。這時候你們就會想出別的辦法,我相信總會有新的辦法出來的,不到萬不得已你們也不會去動底層的東西,由於工業界像英特爾這些大公司,他們有那麼多的投入在硅上面,因此硅的工業還會再往前走,只不過對於芯片的架構,可能在設計層面會有新的花樣出來

李卓桓:最近中美國家間的齟齬愈來愈深,將來能夠預見一段時間的技術封鎖,各技術領域的人才往芯片或者芯片相關的方向流動,你以爲這對於你們來講會是一個更好的機會嗎?

郝少剛:我以爲這裏是有機會的,如今在長三角地區其實已經看到這樣的趨勢了。咱們從事半導體硬件行業的這些同窗,他們的薪水開始提高。另外也有一些大的企業也開始從事生產一些相對沒那麼複雜的芯片,好比人工智能芯片雖然賣的貴,但實際從技術角度來說,它比 CPU 仍是要容易製做一些。另外包括有一些像光學類的芯片,它的線寬要求沒必要太細,可能微米量級就能夠。也就是說如今可能不須要特別先進的設備和技術咱們也能夠先突破,而後開始進入。並且最近我注意到海外也有不少這一類的人才開始迴流。

青潤:其實物理學是我特別感興趣的學科,惋惜最後路走「偏」了,大學去了瀋陽的一個學校讀材料加工工程,最後卻發現,其實材料加工工程也是物理化學的一個很深刻的方向。可是在那邊待了一年多以後,發現了一系列的問題,由於中國科研當時的體制讓我感受很差發展,就直接自學計算機編程,本身學完了計算機相關的全部專業課程,隨後一畢業就改行了。固然畢業以後又在那邊幹了半年,完成了導師交待的最後一批實驗,也算是做爲一名材料系學生所作的最後的貢獻,後來那個方向就完全放棄了。

出來以後開始寫 JAVA 代碼,當時也遇到了一些問題:就是你們都在寫代碼,但上面的管理人員不懂,那個時候程序員的薪資確實比其餘行業看上去要高一些,因此就有一些對技術不是特別感興趣的人「混」了進來。固然很差說人家是混進來的,別人可以把這個事情接下來也說明自身是有必定的本事的,好比表達能力比較強,口才比較好等,更容易與一些上層管理來作溝通,而技術員每每拙於溝通,寫代碼的時候才感到是最幸福的時候。

到如今我一直都以爲,在我當程序員 20多年的歷程裏面,最幸福的時候就是在 2000 年左右,那時我仍是一名單純的程序員,個人任務就是千方百計的把功能實現。當時咱們是在IBM的Websphere上寫東西,用的數據庫是 db2,結果發現國內沒有一本中文資料,只好到外網去查,當時國內可以買到一本書就叫《DB 2 從入門到精通》,結果哪有什麼精通,就是把手冊翻譯了一遍就出書了。這也是後來我寫書的時候極力要去避免的事,我這人可能在這方面比較笨,第一本書寫了3年,後來又寫了 6 年以後出版了第二版,說白了就是我 10 年就只寫了一本書。

兩千年開始接觸 UML,剛開始也是各類抵觸,可是真正在項目裏把它用起來以後才發現這個東西真的很好用。尤爲是從模型到代碼的轉換過程會讓咱們的視野從代碼層面真正脫離出來進入到架構和模塊級別以上

當我發現了模型化以後,它會把你的視野從代碼層提升到真正的架構層,例如當你進入到一個生產線上的時候,你很容易會被上面的某一個具體操做所吸引,這個很簡單的機器結構就會鎖住一我的,你會在那裏面永遠突破不出來,很難把本身的視野從這個點提高到整個生產線上。UML 就在軟件開發領域起到了這個做用。

隨後離開了電信,又進了中科院。爲何進中科院?是由於當時咱們的研究員李老師,他是國際上人臉識別領排名前幾位的專家,微軟最先的人臉識別就是他帶着團隊作出來的,這個技術方向吸引了我。

在這個階段中遇到了一系列的問題,好比當時人臉識別、行爲分析和動態識別,如今你們常常提到的人工智能在咱們那個時候其實都已經在操做了,在操做的過程當中遇到了至關多的問題,由於那個時候還有點早期,市場理解度並不夠,並且當時我也錯過了一些機會,好比在 07 年有一個廈門的老闆願意投 1500 萬,我當時直接傻了說:500 萬還能夠 1500 萬我以爲我接不住,後來就錯過了這筆資金。

後來我出來創業的時候發現個體的力量在一個體系面前幾乎是沒有機會的,因此那次創業後來也失敗了。你們感興趣也能夠搜索找到當時的一些信息,包括周華安作的水木社區上面,個人經歷都曾經上過好幾回十大排行榜。我以爲水木是一個很是奇葩的社區,到如今仍是天天都有好幾萬人,甚至高峯的時候是 20萬人同時在線,這是一個很是奇葩的事情。

李卓桓:當年你們沒有其餘的溝通渠道,我以爲在我們的成長過程當中,像早期的 BBS 技術交流,對咱們產生了巨大的影響。我身邊不少大神朋友都是當年的在 BBS 上認識的,由於當時能上網的人還不多,因此能見到的同時又學得很早的幾乎都很厲害。

青潤:其實這一項提到的新技術點還有一個事情,好比我 05 年再次進入中科院,離開企業應用軟件行業,06 年忽然據說Spring 架構如何,我想說我畢竟寫了那麼多年架構代碼,就回去看了一眼,結果發現這不就是 02 年咱們用過的東西嗎?只是當年咱們沒有把它提煉出來而已,沒什麼區別。因此若是你去查的話,能夠找一本2002年出版的叫《J2EE核心模式》的書,那本書上有一個 helper 模式,和 Spring 幾乎是徹底相同的,你們能夠有興趣的能夠去查一下,固然這都是翻老古董的東西了,沒有書的話不查也無所謂了。

因此咱們再來看,新的技術點究竟是什麼?其實就是有些人把常常重複的東西提煉成爲一個通用的點,而後把它標新立異提出來了。若是你沒有提出來,那麼就只能檢討,在枯燥的工做中,本身爲何就沒有想一想,把它作個簡化提煉的工做呢?是抱怨本身的工做枯燥重複無心義,爲何就沒有想過更簡單更能夠偷懶的方式呢?程序員原本就是爲了偷懶纔來當程序員的嘛。

李卓桓:真正經典的東西,其實都是已經存在生活中不少年,可是我以爲有一些新技術,它的價值在於會有一批人可以把重複出現的這些東西總結出來,而且把它作成一種模式,可讓將來的全部人不用再去從頭總結,或者再重複這些過去已經總結出來的東西,進而產生了新的一輪迭代。

郝少剛:如今市面上你們經常使用到的這些人工智能上的算法,可能都是幾年前甚至 10 年前的論文,只不過如今用的人更多了,你們發現能夠在更多的應用場景裏面用到它們,而後纔開始擴散開來,因此這些東西你們可能覺得它是新的,其實不少都已是 10 年前的產物了。

李卓桓:這裏關於新舊的概念我以爲也要分一下,一個東西出現了,我以爲在沒有被大衆知道的狀況下,在沒有被大量應用到實際的生產生活中以前,就不可能真正去改造世界和創造價值,我認爲就不能稱之爲存在。

真正的存在應該就像少剛剛纔說的那樣,好比人工智能反向梯度這種學習方法,實際上是上世紀就有的東西,可是它無法匹配相應的硬件能力,只有那麼一些算法、論文放在那裏。我以爲從廣義上來說,一個很厲害的新技術只有被人民羣衆用起來,這個瞬間才應該叫誕生。

郝少剛:其實對這種轉變我是頗有體會的,由於那個時候搞科研,你會以爲你作的東西都很好,只要寫成論文而後放在那裏就已經很是好了,有句詩說的是「花自有本心,何求美人折」,意思指的是:我已經長得這麼好看了,即便沒有人來折我也是能夠的。

可是到了工業界之後,你就會發現這些成果最好仍是能儘可能改變到咱們的平常生活,就像另外一首詩「遲遲白日晚,嫋嫋秋風生。歲華盡搖落,芳意竟何成」。最後你這朵花也開了,開完也敗了,可是沒有人欣賞,芳意竟何成就是沒有意義,沒有感受,因此會有兩個比較大的對比。

李卓桓:我發現不少技術圈的牛人同時也是文人,剛纔少剛的詩已經達到了騷客的級別。

青潤:我記得大概是 96 年,當我還在讀本科的時候。我師姐作了一個鑄造流體模型的計算,它的這個計算須要差很少 5 天以上的時間,常常在電腦上貼了一個「請勿關機正在作計算」的紙條,後來有一天我偶然幫她看了一下代碼,我說:「你的這個模型最後處理出結果的那段,能夠把它放到最後一塊出」,就這麼一句話,讓總體的計算時間從 5 天多變成了 6 個多小時。

2005 年的時候,咱們在作人臉識別,當時有一個叫活體檢測技術。像如今你們看到的活體檢測技術其實叫活動檢測,看你眨眼、晃晃頭、笑一下和張張嘴,這叫活動檢測,不叫活體檢測。其實活體檢測的是你的眼球對應的反光點的不規則波動,咱們在 04 年的時候就已經作到,可是當時若是作這個事情,咱們人臉識別的速度就會從 20 多秒直接變成了 5 分鐘,用戶確定無法接受了,這個時間你們等不起,因此這個技術後來就被拿下來了。

這表明了什麼?說明當時的計算能力真的不夠,我記得當時我在自動化所還拼湊了 1 臺搭配 4 個 32G 內存掛載 10 塊硬盤的一臺機器,而後發現一臺變壓器徹底帶不動,最後弄了兩個變壓器來帶這臺機器。在我離開以後這臺機器也就被分拆成兩臺機器,由於確實太耗電了。當時的處理能力相比如今真的差太多了,能夠這樣說,如今隨便一臺普通智能手機都比咱們當年奔四的計算機處理能力要強,如今手機上幾乎都可以作人臉識別了。

李卓桓:我以爲咱們都是在各類暴露年齡啊,當年硬盤真是存 100 塊好像都趕不上如今手機的存儲容量大。

其實不一樣的年代都會有不少技術特別吸引人,尤爲是對我本身而言,我其實從很小的時候一直都會被各類技術所吸引,如今回想起來彷佛每年吸引個人技術後來都有了很大發展,但當時我只是以爲很好玩。

好比在初中的時候以爲遊戲機很好玩,而後就會思索這個東西是怎麼作出來,就去自學了 basic。在90年代的時候,basic 應該也屬於很前衛的技術,雖然 basic 不是最好的語言。

在初中的時候就已經能用 basic 實現一些小數據的控制,而後發現還有不少的數據須要處理,因此我在高中的時候就自學了 FoxSpace,也屬於那種很早期的數據庫,我以爲不少的新技術它是取決於人身邊的各類需求,這種需求解決的時候就會出現不少之前沒有的技術,如今爲了解決這個需求所誕生的這種新技術在將來就會對不少事情作出改變。

我在上大學的時候首選北京,主要由於當時想要上網。我高中的時候咱們那個地區沒有網,因此只能抱着電腦報看,電腦報是很早的一個電腦報紙,上面就有不少大城市的人說:「我又加了個 BBS ,個人電話線在晚上歡迎打給我,個人電話號碼是多少等等」,由於那個時候想上網須要先打電話給那臺服務器,而且那臺服務器同時只能服務一我的,那個時代就會有這樣的站長。

後來到了北京以後,以爲互聯網可以讓你實時獲得那麼多的東西,可以讓你沒有任何限制獲得那麼多的信息,就感受很興奮。當時我就作了一個動漫站,由於我很喜歡動漫,喜歡處處下動漫,當時也沒有視頻全都是小圖片,但有不少小圖片就已經很使人興奮了,由於本身有這種收集數據的訴求,當時我就作了全清華最大的一個 FTP— 「紫霞 FTP」。

紫霞站就是個人站,因此 zixia.net 這個域名就是當時我租下來自用的。我最開始試圖想作一個網站,第一步是用 ASP,在 98~99年那時候,它還屬於很先進的技術。由於那個時候沒有開發成型的語言,就用 ASP 作論壇,當時用起來也確實很不錯。可是再往前走,就會發現有一些限制,而後再去請教一些人,他們告訴我還有更好的東西,因此在那個時候我又接觸了 leedays,爲了實現全部的站,我就開始學習各類各樣配置網絡服務器的技術。

爲了知足本身的玩興而學了不少東西,因此我以爲若是你真的想玩一些很前衛的技術,你就會發現有一些技術須要去學習,那麼你就去學它就對了,由於你要相信本身喜歡的東西在將來必定不會錯。

後來到了第一輪互聯網浪潮的時候,我供職於國內一個叫  ChinaRen 的網站,後來被搜狐收購,當時我在的部門基本上只有 3 我的,但全部的服務器都要由咱們來作內核編譯,包括各類郵件服務器的架設備份等,全部的都要作,也須要不斷的學。

藉着作這個的經歷,我寫了個人第一本書《leedays 網絡編程》,仍是在清華讀書期間寫成的,後來隨着須要作的東西不斷增多,我又自學了 perl,甚至有一段時間任何東西我都想用 perl 來寫,由於 perl 當時還很好。而後爲了作畢設又不得不自學了JAVA ,在不少公司還要作 DBA,後來爲了作服務器,要學當年超級難用的 RPC。雖然不少東西后來也再也不用了,意外卻發現當年學的這些技術有不少竟成爲了互聯網中很是重要的一些能力。

給個人感覺就是:本身喜歡一個什麼樣的應用場景,當你想要在這個場景裏面成爲主人的時候,你就須要有不少 Powerful 的能力。這些技能點其實我以爲就選本身喜歡的去點亮,會有很大的機率點亮到一個將來可以改變世界的,尤爲是當年互聯網興起的時代,咱們看見這些技術對於以後的十年乃至更久都有很大的顛覆機會。

好比2008 年移動互聯網誕生的時候,由於你們當時都在用電腦,你會發現不少人但願有一個隨身的移動設備,若是可以移動上網,拍腦殼想都知道這是特別炫酷的一件事。爲此我甚至去學了 iOS 編程和安卓編程,還寫了不少小的 demo,試圖更深入的理解它們。雖然本身沒有在移動互聯網作公司,可是咱們 PreAngel 當時投了不少移動互聯網公司,到最近這 5 年,個人興趣又被一個新的技術完徹底全所吸引,它就是AI。爲何會喜歡它呢?仍是由於我是一個特別笨特別懶的人,因此我就特別但願找到一個方法可以讓我借力。不過由於我在清華讀的不是計算機系,算法基礎相對較差,若是讓我去作人臉識別,我以爲和青潤比起來,簡直徹底不知道發生了什麼事情。

如今的人工智能有一個什麼樣的機會呢?機會就在於如今算力有了很大提高以及讓咱們擺脫了過去全部算法的桎梏。咱們發現咱們不須要去了解那些細節,之前的機器須要你告訴它具體怎麼作,它纔可以把這個事作好。如今的機器你會發現可以有一個新的能力,這種能力叫作「授之以魚不如授之以漁」,就是你要教會機器本身去作,而不是說手把手的教它如何去作。如今的電腦我以爲已經到了一個新的階段,電腦可以本身去總結出來一些規律,而不須要你總結了以後讓它背下來再去作。

我還發現這樣的一個新技術在將來必定可以真正改變人類生產力,我和朋友分享說人工智能可能比互聯網還要偉大,超過兩個量級都不止。這是我對新技術的感覺,找到一個本身喜歡的新技術,我相信你們只要能作進去,最後收穫都不會小。

郝少剛:很是贊成卓桓的說法,由於在量子計算領域咱們傳統的辦法都是一種演繹的辦法,就是從最基本的原理出發,而後用公式推理出來。可是到了必定程度你再進行模擬的話,它的時間複雜度是很是高的,代價很大,可能這個時候就沒辦法進行擴展。有 AI 咱們就能夠從另一方面,用概括和統計的辦法從數據側來看,因此咱們如今也在作一個新的嘗試,但願用 AI 的辦法幫助咱們加速量子計算,也就是量子模擬。

另一點我以爲卓桓說的也特別好,就像咱們的生活,每一天你要獲得一些正反饋,而後你纔可以比較開心的進入下一天。你喜歡那個東西,而後你獲得了正反饋,才能更好持續下去,有收穫。若是咱們獲得的是負反饋,好比以爲學的這些新東西是生活所迫必需要學,這就不是很開心了,效果也不會很好。

青潤:興趣很重要,就像我到如今還記得86年學計算機的時候,我是怎麼成爲老師最好的學生的,是由於有一天我把他氣哭了,以後就特別內疚,纔想要好好學習這門課,並且發現這門學科確實頗有意思。

想一想在 86 年那個時候,你可以在一個電腦屏幕上顯示出本身定製的一些花紋紋路,還能夠操做一些事物,相似於街頭遊戲機裏面的一些東西,還能夠本身把它拼裝起來,那是一個多麼新穎的事情啊。

後來街頭的遊戲機我就不去玩了,我發現我本身好像本身也能幹,因而就開始本身編。固然編的就很通常了,由於那時候用的只有一個配色,硬件用的就是 310 機和蘋果I型II型機,當時蘋果I型II型咱們還不能常常用,由於價值很貴,咱們用的最多就是 310,這個 310 是日本模仿蘋果的一款機型,不少朋友大概也就在書本上見過。

我最近在知乎上遇到了一我的,他說本身是由於興趣纔來作計算機的,而後越作越枯燥,就以爲很無聊。我就回了一句話,我說怎麼可能越作越無聊,真正有興趣的人絕對不會由於你作的事情的重複性而感到無聊,只會以爲可能還有地方沒作好,因此這一點特別重要

03 處理與新技術的關係

李卓桓:我們都作了那麼多年,在感嘆過去這些「新」技術的時候,將來我相信還會有更多的新興技術會出現。你們以爲將來還會有哪些重大的技術將會出現,另外從技術人職業發展角度來看,咱們每個人應該怎樣作好選擇以應對將來技術發展?

郝少剛:我先談一談,若是是個人話,第一我以爲仍是興趣驅動,首先是你願意去接觸它,它是來發動你,激起你心裏好奇的一個點。當你對平常正在作的事情已經很熟悉了,可能處在一個溫馨區中,天天的事情在能夠頗有效率得作完的狀況下,你會有一些其餘的時間,看一點這些東西,這個時候興趣在其中會起到很是大的做用。

若是把興趣拋開,就是你對將來趨勢的一個判斷,你可能對這個技術沒什麼興趣,可是如今好像不少人都很關注這塊,它之後可能會變成一個大事件,這時候你也能夠對它有所關注。你但願之後也能投身於這個領域,作出一些東西來,對整個社區和你們的生活產生一些貢獻。這是目前我以爲兩大比較基本的因素,可能會驅使一我的去找他比較喜歡的技術點。

另外我以爲若是咱們時間更多一些,或者你的好奇心更重一些,那就能夠對一些「不沾邊」的東西看得更廣一些,好比說如今咱們得到知識的渠道太多了,並且很是的便宜。像上網得到知識的成本很低,資源很是多,因此我以爲能夠花不多的時間對不少東西均可以掌握個大概。好比二八原則,咱們花 20% 的精力,就能夠對一個東西有 80% 的掌握,這樣就能夠把咱們的知識面和視野鋪的更大一些。在新的領域裏面,你可能又會發現一些使你感到有興趣或者是你感到興奮的一些點。

李卓桓:我以爲少剛說的很對,如今和 10 年前不同了,和過去比起來,咱們獲取信息的渠道愈來愈豐富,並且從另一個角度來看,互聯網上可以製做出特別優秀內容的內容生產者,隨着整個互聯網的基數變大,也會愈來愈多。因此若是咱們可以用英文來搜索的話,咱們基本上可以很快的獲得全球上最好最早進的新技術,以及那些頂級的講師或者寫手他們總結出來的特別高質量的文章和知識的教程。

因此從這個角度來說,其實咱們如今獲取新知識的能力變得比之前強了不少。其次我想引伸出來另一個觀點,從某種角度來講,隨着技術迭代的變快,咱們不可避免的會面臨着咱們學過的知識會「過時」。

其實我一直不太相信知識會過時,由於當你可以學到一個新的知識的時候,最重要的是你要能學到這個知識背後的通用模式與思考問題的方法。其實若是咱們你們寫程序用的語言多了以後,你會發現其實語言之間就是語法不一樣,思惟模式和解決問題的思路都是相通的,咱們是能夠經過不斷學習這種新知識而沉澱出來,變成本身內化的一個通用的思惟模式。因此對於學習新技術,我以爲徹底能夠只是看它是否有足夠有新的點可以去解決新的問題,並且我以爲學了都不虧。

郝少剛:通用的東西在你身上沉澱下來之後,你學新的東西就會更快。你我的其實也是在不停的迭代,並且每次都迭代得更快,你就變成了一個更有效率的學習者,因此至關於咱們在訓練本身大腦裏面那些神經元,你訓練的越多,它就越願意去學習,越主動,越有好奇心,我以爲正反饋是很是好的。

青潤:就像剛纔說到的人臉識別,其實我如今也寫不動人臉識別代碼了,雖然人臉識別代碼不是我寫的,可是對於人臉識別的理解,我反而有必定的心得,這也是我如今可以去作跨物種的語言互通技術的緣由。

我把這套思惟的方式轉換到了一個應用場景內,好比說大家家有寵物狗,當它聽到過一個聲音,或者發出某一個聲音的時候,會習慣性的擡一下左手,這時候我就會記錄下來。當你須要它擡左手的時候,能讓你發出的聲音在狗那邊聽到的就是讓它擡左手的指令,這樣作到跨物種的語言互通,而不是依靠傳統的巴普洛夫效應讓狗聽從指令。

這是我在第二次進中科院以後掌握到的最重要的東西,反而不是寫的那些代碼。還有人說你看看你如今多失敗,你那麼早進入人臉識別領域,如今的人臉識別公司卻沒有一個和你有關的。我說確實是沒有一個和我有關的,可是如今幾乎主流的人臉識別公司裏面都有咱們那個組或者咱們那組相關聯的痕跡在裏面。其實不表明說你本身必定要在裏面得到一些直接的東西,這些工做可能會在另外一個層面上產生相應的做用。

李卓桓:我還有另一個建議,咱們你們在學習新技術的時候,最好不要爲了學而學,最好能找到一個讓技術實際去落地的場景,哪怕是很是初級的一個場景,可是隻要你可以把它實際用起來,你的學習收穫、感受就會徹底不同。由於它再也不是一個死的知識,而是一個活的東西,是真正能解決問題的知識。

04 Q&A

Q:咱們處在機器配置這麼好的年代,爲何感受產出卻不如之前呢?

李卓桓:其實這個問題是頗有表明性的,我以爲若是咱們要作的話,首先就要把心態放長遠。分爲兩塊,第一,過去這 10 年,有不少的基礎數據,具備表明性的像準確度,像坐火箭同樣往上漲,但咱們不能期待之後永遠是這樣的。爲何?由於過去 10 年的人工智能發展,不管是圖像仍是 NLP ,它們最大的特色就是已經把過去全部基礎研究的能力釋放乾淨了。

像80~90年代的反向梯度傳播和好久以前就有的卷積神經網絡,最先是由於咱們沒有算力,因此它們沒有辦法被釋放出能力。但其實在過去的這5年多甚至10年中,不少基礎研究的能力,典型的如圖像的準度已經從92%、95%、97%,到如今人臉識別的準度都能達到百分之九十九點幾了。因此接下來作這個領域的時候,並非說咱們的機器配置好了,就沒有再提高的機會了,而是由於咱們已經提高不少了。

接下來咱們要作的事情我以爲會有兩個很大的機會,第一就是作新的基礎研究,不是把 95%變成 95.5%,只專一於提高一兩個百分點。而是要發掘新的問題,找到問題的新的解決辦法。好比在天然語言處理裏,不少語義的問題到如今其實尚未被真正解決,甚至都沒有被定義出來,我以爲要在學術領域努力解決這些問題,纔會真的對人類產生很大的積極貢獻。

第二點可能更切實際一點,咱們的開發者其實有一個很大的機會,如今有不少的人工智能算法可能已經達到了 99% 的準度,但其實它在真正的人文生活應用中,在真正的產品化落地上還很是的侷限,有不少的場景,並無把技術真正用起來。好比說圖像識別裏面的物體檢測就有不少的場景,它須要大量的這種能力,可是到如今爲止並無一個產品真正能解決它們的問題,而像這樣的落地機會也還有不少。

青潤:我補充兩點,第一,人臉識別的準確度尚未到九十九點幾,這更可能是一種商業上的宣傳。實際上在人臉識別裏面咱們作的方式是什麼?就是拿你的歷史數據,抽取一個特徵碼,當你再一次過來驗證的時候,就會再拍一張照片,用一樣的算法來提取特徵碼,提取完兩種特徵碼中間確定有差別,好比光照、傾角、臉的傾斜度都會有差別,而後這二者我作數值異或。數值異或的速度是很是快的,你們知道計算機裏面最快的計算就是異或,計算這個百分比有多少是類似的,多少是不類似的,若是相差比較大的話,可能會再作一些圖形的變換,好比說作一個傾角的轉換,最後再來比較。

其實這裏提到的就是兩個概念:一個是識別率,另外一個是誤識率。這二者之和是大於100%的。具體的緣由有興趣的朋友能夠詳細瞭解一下人臉識別的相關技術以及定義方式。即便是識別率中等類似的那部分它也是有價值的,由於每一個人不一樣時間的兩張照片是不可能作到100%類似的,甚至80%以上的類似機率都很低,因而在商業計算中會把那個20%(這裏是一個假設的數值)直接去掉而後折算出來的結果每每就能夠達到90%多以上了。

實際上如今和咱們10多年前作的那套人臉識別算法和數值異或上的差別,到如今也沒有特別大的突破,數值得分大概就在70%左右。但實際上在60%左右的時候就已經能夠識別出是這我的了,15年前58%就已是一個比較高的得分了。

假如你用到的人臉識別設備比較多的話,會發現不少時候常常會折騰到不認識,還得從新識別纔可能識別出來。這就是爲何咱們在不斷的調整門限,把這個門限值設定爲70%仍是65%仍是60%,頗有可能你會偶然碰出一個很高的數值出來。

這就有人提到說人臉識別的時候,好比我帶張人皮會怎麼樣呢?其實這個是真的能夠矇混過關的,不要認爲是矇混不過去的。若是讓我來破解的話,能夠說我有不少種方法來攻擊現有這些系統,可是這種方式咱們通常不對外講,由於講多了沒有太大意義,只能說明咱們本身這塊東西沒作好。

目前在計算能力上仍是不夠,這個確實沒有辦法,真正計算力夠的時候是何時呢?如今有可能在硅基芯片上是看不到了,可能量子計算機會帶來但願。

郝少剛:我可能沒有青潤那麼悲觀,我以爲硅基半導體芯片仍是能夠試一下,也歡迎你們到咱們騰訊雲上來試一試,咱們騰訊雲上有很強大的 GPU 集羣,歡迎跟咱們聯繫。

Q:學AI要從那種語言開始學起?

郝少剛:我以爲你們比較經常使用都是先從Python開始,由於像 PyTorch、TensorFlow 都支持得很好,另外 Python 是一個比較容易上手,對新用戶比較友好的一種語言,我以爲用 Python 開始就很好。

Q:AI藥物研發到底前景如何?還有多長的路要走?

郝少剛:AI 藥物研發已是一個趨勢了,最近我看到國外權威雜誌(《天然》雜誌仍是《科學》雜誌)上發表了一篇文章,他們用 AI 作了一些輔助的藥物研發,在很短的時間內就進入了FDA 的審批流程,因此 AI 對藥物研發的幫助仍是很是大的。

由於從分子治藥角度來說,那些小分子數據庫裏面的分子量太大了,都是一些有機的東西,能達到上億的量級。因此在大數據領域裏,從數據這邊來找規律,看哪些東西可以匹配到蛋白質的某一個特殊靶點位置等等這些,都是頗有效率頗有意義的。

至於說還有多長的路要走,須要看你怎麼定義你認爲的彼岸是多遠?若是你的意思僅僅是 AI 技術用在製藥領域的話,那麼咱們如今已經在用了,並且可能還會一直會用下去,經歷不停的迭代、加速優化的整個過程,模型也會作得愈來愈好。因此我以爲不是問還有多長的路要走,而是說咱們可能之後用 AI 變成一個常態,在製藥領域你們都會選擇這個工具,它變成了一個不可或缺的工具,可能還須要至關長的一段時間。

Q:AI 技術水平愈來愈成熟了,在將來發展後會代替人工嗎?

青潤:這個問題背後會牽扯涉及到人類的生存安全的問題,而這個問題也是長期引起社會普遍思考和討論的問題之一。關於 AI 未來會不會真的來害人,甚至國內某知名高校成立了一個學院,要專門研究人工智能法律基礎相關的東西,儘可能減小人工智能對人的傷害。

我從寫了多年代碼的程序員角度來考慮,若是你們有看過一個連續劇——終結者外傳,裏面有這樣一個畫面,一個液態金屬機器人在一大樓上指着下面和主角說:「你看路面上的各類機械車輛,它會按照紅綠燈的指示來進行經過,可是沒有一個機器人會闖紅燈突破這個過程,因此會犯錯的機器人是一個特別特殊的存在」。從目前的技術基礎來講,全部的無論你是什麼形態的代碼造成以後的人工智能算法或者它的邏輯實現算法都有自身的基礎的,它仍是基於一個代碼序列層展示出來的。

若是在代碼序列展示中出現了這種闖紅燈行爲,說明了什麼?它實際上是代碼出現錯誤或者內存溢出了,可是這種溢出行爲可能有連續性嗎?其實從目前來看,還作不到溢出行爲以後的連續性,他若是不能有連續性,換句話他這時候出錯以後會帶來什麼結果?就是手機鎖死了,隨後手機就直接重啓,重啓以後他又恢復到正常狀態,也就是說他的錯誤行爲不會出現連續性的行爲。

即便是我設定了這是一個殺人機器人,他就是爲了殺人而存在的,假設有這樣瘋狂的技術員出現,這也是有可能的。可是他設定的也只是針對必定目標行爲之下的連續性的程序延伸,也不會出現他會把全部的殺人模式都實現出來,也就是說由於異常而滅絕人類的殺人機器人不可能出現,可是針對單一目標的殺戮機器是有可能出現的。

再者你能夠想到一點,人工智能能代替哪些人工呢?其實基礎的可重複性的勞動都是能夠取代的。

我從2004年開始有一個本身的研究方向,不是剛纔所說的跨物種語音互通技術方向,而是抽象化腦力勞動的量化模型研究。這些東西最初的來源是在哪裏?其實就來源於我 2000 年開始接觸的 UML 的建模方法。從那裏我發現了,也許可以把程序員的抽象化勞動,逐層量化出來一個可能的實現途徑,因而就開始往下推動這一系列動做。相似於腦力勞動的抽象化量化,實際上機器未來可以帶來的絕大部分也都是能夠具體量化出來的東西,也就是說目前能被量化出來的工做,就是機器最優先會被取代的東西。

固然有人會說,如今連相似畢加索的畫都能被機器畫出來,但其實那也是一套代碼和模型演算出來的結果,並非真的。因此不要認爲那就是一個畫家,其實仍是一種模仿性的行爲。

Q:關於人工智能中天然語言處理在商業領域的應用,老師能給哪些建議?

李卓桓:這個問題正好問到了個人專業領域,我如今主要關注的就是人工智能技術領域裏面,尤爲 NLP 這個領域的應用,還有像多輪對話,如何在微信上面作這種自動化的客服問答,以及其餘相似的這種人工智能應用。

回到在商業領域來應用這個話題裏,我以爲這個問題最大的價值在於說,咱們要意識到如今的 AI 算法實際上是有不少的侷限性,即使對於不少的數據可以分類得很好,即使它在不少的場景裏可以不知疲倦的工做,比人的效率還高,可是當它到了對話領域的時候,會面臨着很大的挑戰,尤爲是和 CV圖像處理比起來。由於CV圖像處理中不少應用場景相對來說都是客觀的場景,圖中有沒有一隻貓或一隻狗是一個絕對客觀的場景,它的算法作起來比較容易。

可是到了天然語言領域的時候就帶來了不少的不肯定性,好比一我的跟你說話的時候,可能一樣的一句話表明着不一樣的意思,甚至是表明着截然相反的意思。在不少時候,咱們在跟別人說話的時候,其實別人的語氣以及當時現場的情境都和表達的真正意思有很深的關聯,若是你只是把說的語音轉成文字的話,可能會錯失掉不少的信息。

因此對話領域若是要商業落地的話,我以爲第一點就必定要意識到人工智能在這個場景裏面有很是大的先天不足。那麼是否是說就沒有辦法去作了?我以爲徹底不是,其實如今有大量的機會能夠把這種對話能力應用在不一樣場景裏的。

舉一個很簡單的例子,好比咱們能夠去作一些降維打擊的事情,好比如今咱們的天然語言處理已經能夠對基本的單輪對話的語音轉文字有很高的準確度,你們若是用微信語音轉文字就會發現真的很好用。另外若是你去提問一個很清晰的問題,好比你做爲乙方去應聘,把電腦當作甲方,你能夠很認真的跟它講明白一件事,其實基本上也能達到清晰溝通的效果,事實上在單輪對話裏 AI 已經能夠解決絕大多數的問題了。

那麼咱們該如何抓住這其中的商業落地的機會呢?須要咱們去找到真正這樣的場景,而後分辨清楚哪一些是超出咱們能力的,再把它們剔除掉,剩下的有能力作的這些簡單場景裏面,哪一些又是屬於價值最大的,咱們就把它拿過來,在這些裏面再去作最後的篩選。

其實某種角度來說這並非一個技術問題,像如今咱們的騰訊雲提供的不少模型裏面,咱們有不少 API 可以作不少的事情,但關鍵仍是在於你可否有那個創意。舉一個簡單的例子,移動互聯網的時候,咱們你們都有手機,咱們都知道怎麼寫程序,怎麼畫一個方塊,怎麼填色,甚至怎麼作一個3D的東西,可是這些東西在你的手上,你是否是就能作出一個用戶都很喜歡願意傳播的手機應用出來呢?

不少的應用原理都很簡單,並不須要很深的、很複雜的算法或者一些複雜的邏輯,可是它就可以打動用戶。我以爲在接下來的人工智能領域,其實有大量這樣的機會,若是你們可以找到這樣的機會,保持對人工智能侷限的認知,去尋找一個沒有被解決好的場景,而且判斷清楚這個場景是否真的有價值?若是將來有價值就去試一試,這裏面的機會真的很是多。

最後我再稍微作一個小廣告,我過去幾年專門研究過怎麼作聊天機器人的多輪對話,因此在今年3月份的時候,我和另一個朋友專門出版了一本書《ChatBot 從零到一》,專門講述一些如何來作對話和如何思考聊天機器人的應用場景,因此你們也能夠去參考一下那本書,我是第二個做者。

Q:做爲售前工程師而不是程序員出身,想請教老師怎樣才能更好擁抱技術,掌握和提高軟件技術或架構思惟水平?

郝少剛:其實我也不是程序員出身,我是學物理的,青潤兄是學材料的,卓桓是學機械的,咱們三個都不是程序員出身的。那麼怎樣更好地擁抱新技術呢?首先你要喜歡它,對它有好奇心,而後你必定要去實際操做,你跟着作一遍,把裏面的坑都踩一遍,等你再回頭看的時候,就能更深刻的理解它了,等你下次再碰到這個事情的時候,你就知道該怎麼辦了。

Q:5G會對AI產生什麼影響呢?

青潤:由於我畢業以後在電信待過不少年,因此通訊也算是個人專業之一了。尤爲是這幾年咱們在藏區以犛牛開始作研究,也會注重相應的通訊技術對咱們的影響。其實如今 5G 和 AI 這二者並無太大直接關係,你們不用多想了,可是通訊技術對 AI 必定是有很重大的影響的。

爲何這麼說?由於通訊在它的傳輸速率以及通訊方式上,會決定未來 AI 的響應速度以及最終拿到的結果,因此這二者看似沒有什麼直接關係,但仍是能夠交互產生頗有意思的事情。

例如咱們未來考慮在科技館作一些展現,好比把某一個地方的場景直接 3D 還原出來,還原出一個真實的犛牛生活場景,但這些東西以目前的通訊技術來講,只能經過 5G 技術來進行傳輸,由於 4G 的傳輸量是達不到咱們要求的。

在驅趕犛牛的過程當中,咱們會給用戶一個相應的方式,讓他能和犛牛之間產生一個互動。固然咱們不會作過於強迫動物行爲的一些操做,好比用戶跟它說右邊的草質很好,指揮着犛牛往那邊過去,這樣的行爲咱們會處理成一個犛牛能聽懂的指令給到它,這種形態其實就是咱們正在和運營商一塊兒合做推進的事情。

Q:5G的普遍應用會將計算工做所有放在雲,捨棄端側的算力嗎?

李卓桓:這個問題很好,也是我相信的一個趨勢,只不過我以爲要修正一點,永遠都沒有絕對極端的狀況,咱們是不會把全部的算力都放在雲上的。可是我相信愈來愈多的算力,咱們能夠從雲上面直接拿來用,尤爲是這樣一些場景,咱們的隨身設備沒有足夠強的算力,固然緣由是不少種的,好比出於成本上的考量,多是電池或者功耗不夠,或者是一些其餘狀況等等。

可是咱們都知道如今雲端的算力很強大,那咱們是否是可以直接把雲端的算力拿到個人移動設備上來用?好比個人手機可能就不須要用不少的電來計算我 3D 圖形,只須要把任務丟給雲,而後把結果拿回來用就行,在這種全依賴雲的狀況下,個人手機電池也許能夠用兩天三天甚至更久,這就是一個很大的提高,因此我相信這絕對會是一個趨勢。

再舉一個例子,是我我的很是喜歡的一個產品,若是你們感興趣能夠去網上搜一搜,谷歌有一個產品叫作 Stadia 。它是一個遊戲手柄,這個手柄拿回家以後,你不須要任何其餘東西,就能用這個手柄來玩遊戲。可能有人會疑惑主機在哪?主機其實就在谷歌雲上面。

當你打開這個手柄,須要作的就是鏈接到你家裏的 WiFi,鏈接好之後全部的遊戲都在雲上,玩的時候也不須要下載。你家裏的電視也是鏈接到 WiFi,經過 Google Ground Caster這麼一個專門用來投屏的設備顯示遊戲1080P的渲染畫面,甚至它還支持 4K 渲染,只不過對帶寬要求高一些,所有內容都在 Server 上。

因此就意味着你在本地操做遊戲手柄往前走,你的命令會轉到雲上,而後雲上將三維圖形渲染,每一秒推給你 30 幀甚至 60 幀的畫面,這樣你就徹底能夠在本地來玩這個遊戲了。你也不用再下載遊戲了,你們都知道如今遊戲安裝包愈來愈大,下載安裝都很費勁。第二,你也再也不須要什麼主機了,更新的麻煩也能夠省去。只要你有一個手柄,家裏有電視,你就能玩的很好,這就是一個家用遊戲的場景。

其實我以爲谷歌作這個場景更大的戰略應該是放眼將來,好比若是如今咱們把手機作成眼鏡那樣的形式,面臨的主要問題是沒有很大的電池。可是之後若是網絡足夠好的話,咱們就只須要把視頻傳走,再把視頻拿回來,如今的硬件發展處理這些東西是很是省力氣的,因此我以爲除了剛纔提到的遊戲之外,將來的人工智能尤爲是很複雜的人工智能,也會受益於這種模式,讓咱們的用戶體驗變得更好。

相關文章
相關標籤/搜索