這個軟件真不簡單

 

閱讀本文大概須要 5 分鐘。程序員

 


這兩天想必你們應該被一個軟件刷屏了,它的名字叫作 Zao,中文音譯就叫「造」。它爲何這麼火呢?是由於咱們能夠上傳本身的一張照片,他就能把咱們的臉替換成一些熱門視頻的男主或女主的臉,也就是視頻換臉。
安全

好比有人嘗試了把尼古拉斯趙四的臉換到美國隊長的臉上,美隊的氣質簡直就是被壟斷了,你們能夠掃碼看看:網絡

圖片美隊變趙四架構

視頻換臉技術你們應該早有耳聞,但這個軟件有點意思,它抓住了幾個點使得它一炮而紅。ide

第一是這個軟件的效果確實不錯,我拿本身也作了實驗,發現確實它渲染的一些結果幾乎毫無違和感,畢竟這個軟件核心拼的就是技術。工具

第二這個軟件貼近於平常生活,咱們能夠把本身的照片上傳,讓咱們真正成爲視頻裏的主角。另外視頻選材頗有講究,都是一些剪輯過的明星精彩鏡頭,這樣咱們生成的視頻鏡頭會讓咱們有變成明星的感受,很是有代入感。學習

技術實現

做爲一名程序員,固然最關心的可能就是它的技術實現了,毋庸置疑它確定是利用了深度學習的一些技術。我看了一些文章和調研,大致瞭解了一下,下面稍微分析一下里面用到的一些技術。測試

總體而言呢,這個過程分爲三步,他們分別是:編碼

  • 人臉定位spa

  • 人臉轉換

  • 人臉融合

人臉定位

如今深度學習對於人臉識別和定位的研究技術已經很是成熟和精準了,其核心就是使用了卷積神經網絡,即 CNN,不一樣的模型架構對於識別的準確率有不用的表現。

對於人臉的定位,通常是使用臉部的關鍵點定位的,這些點叫作 Landmarks。在一張人臉圖像上,每張臉的輪廓和五官的位置都會被打上點,好比整個臉部的輪廓用一些點描出來,鼻子、眼睛、脣形一樣用一些點描出來。

圖片Facial Feature Detection

通常來講一張臉會用 68 個點來標記出來,每識別的模型接收一張人臉圖像,輸出這 68 個點的座標,這樣咱們就能夠實現人臉定位了。

如今現成的模型也不少了,好比 dlib,opencv 等開源工具包能夠直接拿來使用了,若是要更精準地話可使用更復雜的卷積神經網絡模型來實現,你們能夠了解下相關論文。

人臉生成

有了標記點之後,這個軟件就能夠把咱們的人臉提取出來了,可是這有個問題,咱們上傳的是一張靜態圖片,總不能直接生硬地替換進去吧,好比咱們上傳的是一張正臉照片,那視頻裏的一些側臉畫面直接貼上那不就無法看了嗎?

這時候就要用到另一個核心技術叫作人臉生成技術,有了它咱們就能夠對人臉進行生成了,好比根據一張正臉圖生成一張側臉圖。目前人臉生成技術主要有兩種,有 GAN(生成對抗網絡)和 VAE(變分自編碼器),下面簡單介紹一下它們的原理。

對於 GAN 來講,它叫作生成對抗網絡,爲何叫對抗網絡呢?是由於模型在訓練的過程當中一直有兩個東西在作對抗,這倆東西分別叫 Generator(生成器)和 Discriminator(判別器)。前者主要負責生成一張人臉,越像越牛逼。後者主要負責判斷分辨前者生成的人臉是否是真的,斷定越準越牛逼。兩者在這個過程當中爲了變得愈來愈牛逼,前者就會盡力去生成更像的人臉來欺騙後者,後者也會盡力去判別生成的人臉是否是真的來打擊前者。這樣兩者在不斷地訓練和對抗過程當中,前者生成的結果就會愈來愈好了。

對於 VAE 呢,它是經過一些無監督學習的方式將人臉信息進行壓縮,由編碼器把它表示成一個短向量,這些向量裏就包含了人臉的基本信息,好比膚色、脣形等信息,這樣整個模型就能夠學習到人臉的共性。而後,解碼器將向量解碼,將其轉換爲某一特定的人臉。這樣就等於通過一層中間向量完成了從一張人臉到另外一張人臉的轉換。

圖像融合

最後的階段就是圖像融合了,也就是把生成的新的人臉和原來圖像的背景融合,使之不會產生違和感。

在這個軟件中,視頻是由一幀一幀組成的,那麼在轉換的時候也須要一幀一幀處理,最後處理完成後再合成整個視頻。

以上也就是我所瞭解到的變臉的一些方法。

安全性

有人說,這個技術不是什麼好技術。萬一有人拿着咱們的照片一變臉,就可以把咱們任意的表情和頭部動做模擬出來,拿着去作認證,好比刷臉支付什麼的咋辦,那咱們的錢不就被盜刷了嗎?

對於這個問題,支付寶官方也作了迴應,支付寶稱刷臉支付實際上會經過軟硬件結合的方式進行檢測,其會判斷被刷物體是不是照片、視頻或者軟件模擬的方式生成的,能夠有效避免身份冒用狀況。其中有一個核心技術就是經過 3D 結構光攝像頭來進行信息採集和識別,若是被拍攝物體是平面的,也就是說若是是照片或者視頻,是沒法經過檢測的。

圖片支付寶迴應

這時候我天然而然想到,既然用的是 3D 結構光攝像頭,那麼若是用了 3D 打印技術把一我的的肖像打印出來,或者用一個很是逼真的蠟像來進行刷臉識別,能不能經過呢?我看了一些報道,發現很多案例的確經過了刷臉測試,好比解開了 iPhone 面部識別鎖等等。但要經過 3D 打印技術來模擬一我的的肖像成本仍是蠻高的,因此基本上也不太會有人來搞這些。

若是對此還心有餘悸的話,支付寶還回應稱,即使是真的被盜刷了,支付寶也會經過保險公司進行全額賠付。

因此基本上是不用擔憂其安全性的,尤爲是 Zao 這個軟件的出現是沒有對刷臉支付的風險形成大的影響的,其就是增長了一個視頻模擬的實現,對刷臉支付的安全性沒有出現大的突破性威脅。

隱私性

這個就要好好說一下了,這個軟件的出現同時引發了另外一個軒然大波,那就是其中的隱私條款。

其隱私條款有一條是這樣的:

用戶上傳發布內容後,意味着贊成授予 ZAO 及其關聯公司以及 ZAO 用戶在「全球範圍內徹底免費、不可撤銷、永久、可轉受權和可再許可的權利」,「包括但不限於能夠對用戶內容進行所有或部分的修改與編輯(如將短視頻中的人臉或者聲音換成另外一我的的人臉或者聲音等)以及對修改先後的用戶內容進行信息網絡傳播以及《著做權法》規定的由著做權人享有的所有著做財產權利及鄰接權利」。

這條款沒人說還真沒注意到,由於通常咱用一個軟件,通常不會去仔細看它的條款,那麼密密麻麻的一坨,有幾我的會去仔細看呢?但要不一樣意,這個軟件還無法用,因此用過這個軟件的人,這個條款必定是已經贊成了。

這條條款實際上是很過度的,贊成授予 Zao 及其關聯公司以及 Zao 用戶在「全球範圍內徹底免費、不可撤銷、永久、可轉受權和可再許可的權利。注意這裏有幾個詞,徹底免費、不可撤銷、永久、可轉受權、可再許可,這幾個詞就表明咱們已經把咱們的肖像權永久授予了 Zao 及其關聯公司了,並且不能撤銷,帳號註銷了也不能撤銷,也就是之後它們能夠有權利永久濫用咱們的肖像。更可怕的是,其中還有一個詞叫可轉受權,那也就是說,Zao 能夠對咱們的肖像權進行轉受權,你懂得,給點錢,啥辦不到呢?這就更沒法控制了,這可能就意味着,世界上任何一我的可能都能得到咱們的肖像權。

因此說,若是你還沒用的話,必定要謹慎謹慎再謹慎!

哎,反正我已經贊成了,貌似我如今也沒什麼辦法了。

社會影響

這個軟件的出現,更深一點想,其實它所隱含的影響仍是蠻大的。

有了這個變臉技術,若是有人得到了咱們在條款裏面所」捐出「的肖像權,拿着咱們的照片去生產那種你懂得的影片,把視頻裏面的男主或者女主換成咱們的人臉,而後處處傳播,或者以此做爲敲詐勒索的工具。即使咱們有理,那也說不清了,首先這個條款已經說了它們能夠有權利隨意使用咱們的肖像,因此告侵犯肖像權已經行不通了,並且即便咱們有證據證實這是假的,但這種視頻的傳播也必定會帶來很是大的影響。

按照如今大衆們的觀念,好比說一張圖,咱們若是不信的話能夠說它是 P 的,但若是換作是視頻的話,不少人可能就會相信了,由於不少人不知道視頻中的肖像也能夠僞造得這麼真了,畢竟不少人並不知道這種技術。所以,有了這種技術的出現,之後視頻類的證據,可能也不可信了。所以這個軟件的出現,能夠說從另外一個側面昭示,之後視頻也不能做爲犯案的證據和驗證人的真僞的依據了。

因此之後多是這樣子的:

  • 坐在電腦面前的網絡女主播,即使不開美顏和濾鏡,你所看到的她也不是真的她了。

  • 你要給人打個錢,說開個視頻吧,我看看是否是真的你,即使看到的是他,你也不能信了。

  • 有人要 Qiao Zha 你,把你的人臉換成 Zuo An 分子的臉,你到哪裏說理去?

  • 某一天,你做爲男女主角,出如今了 P 站和 91….

我一開始想的還沒這麼深,邊想邊寫,寫到這,我本身都開始後怕了…

怎麼甚至感受,之後的社會可能會亂套了呢?這可能就是 AI 發展的一個隱患吧。

因此寫到最後,雖然這個軟件頗有意思,但仍是勸你們尚未用的就不要用了吧,真的很可怕。同時我也不知道這個軟件這樣的條款和作法會不會有什麼問題,但仍是但願能引發有關部門的注意。

之後,也但願你們也能夠在使用軟件的時候,要更加謹慎和當心,有條款就稍微看一看,尤爲是對於這種和用戶隱私相關的軟件,要更加心存戒備。

相關文章
相關標籤/搜索