TensorFlow 發佈的第四年,哪些最重要?@GDD 2019

GDD 進行到次日,開發者們依然熱情不減, TensorFlow RoadShow 現場座無虛席。距離 2015 年 TensorFlow 面世,現在已過去四年,圍繞 TensorFlow,谷歌打造了一整套生態系統,用戶羣體也愈來愈廣大。那麼這一次,谷歌的 TensorFlow 團隊,又爲咱們帶來了什麼呢?小程序

昨日,GDD 大會上,谷歌對最近的動態和新品,作了詳盡的展現。在 GDD 的次日,則是將重心傾注在了已發佈四年的 TensorFlow。微信小程序

今日凌晨,蘋果召開了新品發佈會,推出了三攝 iPhone 11 系列,此外 iPad、 Apple Arcade、Apple TV+、iApple Watch Series 5 等新品也隨之發佈。瀏覽器

若是說蘋果在用新品刺激着消費者羣體,那麼在大洋的另外一邊,谷歌開發者大會則還在低調而沉穩地進行,詳細地介紹着本身在技術上最新進展,給開發人員帶來最實際的幫助。服務器

特設的 TensorFlow RoadShow,排滿了整整一天的日程。那麼今日的 GDD 上,TensorFlow 團隊又帶來了哪些看點呢?微信

TensorFlow:最受歡迎的機器學習框架

在 TensorFlow RoadShow  上,其亞太區產品經理梁信屏首先出場,展開了《機器學習的如今和將來》的分享,並陳述了 TensorFlow 的發展概況。網絡

梁信屏爲 TensorFlow 的發展作出了分析

當前機器學習發展的關鍵有三點:數據集、算力和模型。而 Tensorflow 則是機器學習潮流順應下,最成功的一個機器學習平臺。框架

從 2015 年發佈以來,TensorFlow 一直在完善和更新,截至目前,有超過 4100 萬的下載量,超過 5 萬次提交量,9900 次代碼改動請求,以及 1800 多位貢獻者。機器學習

TensorFlow 擁有着龐大的用戶羣體

由於它的強大功能,使用 TensorFlow 的實際案例也愈來愈多,多家企業和機構在用它進行研發。此外,TensorFlow 中文網站也已開通,中文社區和技術資源都在日漸擴增。工具


介紹完這些狀況,隨即開啓了  TensorFlow 的全面展現,其團隊的工程師們,對 TensorFlow 的進展作了詳細介紹。性能

劃重點:TensorFlow 2.0 


備受矚目的 2.0 版本終於在 2019 年面世。今年 6 月份, TensorFlow 2.0 Beta 版本發佈,在今天的 GDD 上,工程師宣稱 TensorFlow 2.0 RC 現已可用。相比於 1.0 版本,新版圍繞易用性、高性能、可擴展,三個方面進行了升級。

其中最吸引人的地方在於,使用 Keras  做爲高階 API ,優化默認 Eager Execution ,移除重複的功能,提供了統一 API 

工程師介紹了 TensorFlow 2.0  圍繞 Keras 作的改進

TensorFlow 2.0  使用 Keras 和 Eager Execution,可以輕鬆構建模型,在任意平臺上實現生產環境的穩健模型部署。

介紹完 2.0 的具體狀況後,谷歌工程師梁豔慧也詳細介紹了從版本 1.0 升級到 2.0 的方法。

在谷歌內部,已經開始了內部的版本遷移,官方網站也提供了詳細的代碼遷移指南與工具。若是用戶十分須要或者依賴於某個 1.0 版本的 API,能夠根據指南輕鬆地將其遷移至 2.0 版本。

那麼 TensorFlow 2.0 具體在哪些方面值得關注呢?谷歌的工程師們從如下幾個角度作出了詳細的介紹。

TF.Text:訓練 NLP 模型 


做爲機器學習中一個重要的方向,天然語言處理有着很大的市場需求。TF 官方推出和升級了 TF.Text,爲 TensorFlow 2.0 提供了強大的文本處理功能,且兼容動態圖模式。

TF.Text  具備多項優勢

TF.Text 是一個 TensorFlow 2.0 庫,可使用 PIP 命令輕鬆安裝。可以在基於文本的模型中按期執行預處理過程,並提供 TensorFlow 核心組件中並未提供的、關於語言建模的更多功能和操做。

其中最多見的功能就是文本的詞條化(Tokenization)。詞條化是將字符串分解爲 token 的過程。這些 token 多是單詞、數字和標點符號,或是幾種元素的組合。

TF.Text 的 Tokenizer 一種用於識別文本的新型張量, Ragged Tensors。並提供了三個新的 Tokenizer。其中最基本的是空白 Tokenizer,能夠在 ICU 定義的空白字符(例如空格,製表符,換行符)上拆分 UTF-8 字符串。

TF.Text 庫還包括歸一化、n-gram 和標記序列約束等功能。使用 TF.Text 有許多好處,例如用戶不須要關注訓練和預測的一致性,而且不須要本身管理預處理腳本。

TensorFlow Lite:在端上部署機器學習


兩位谷歌資深軟件工程師王鐵震與劉仁杰,介紹了 TensorFlow Lite 的功能更新以及技術細節。

TensorFlow Lite Roadmap 一覽

TensorFlow Lite 是用於手機以及嵌入式設備上,部署機器學習應用的框架。之因此選擇在端上部署,主要的考慮體如今如下三點:

第一:幾乎沒有延遲,能夠提供穩定、及時的用戶體驗;

第二:不須要鏈接網絡,能夠在沒有網絡或者是網絡不好的環境中使用;

第三:隱私保護,不會把數據傳到雲端,全部的處理可以在端上進行。

鑑於這些優點,目前基於 TensorFlow Lite 在端上部署機器學習的應用,已有有了很大的市場,並且在 2.0 中,部署模型的能力也獲得了強化。


好比,閒魚 APP 在租房場景,用 TensorFlow Lite 自動對圖片打標籤,提升了租房效率;科沃斯機器人將 TensorFlow Lite 部署在掃地機器人中,實現自動避障等等。TensorFlow Lite 在谷歌產品中也被普遍應用,如 Google 相冊、輸入法、雲助理等。

根據統計,有超過 20 億的移動設備,已經安裝了基於 TensorFlow Lite 的應用。

不過,在端上部署機器學習仍然有着很多的挑戰,好比相對雲端來講,端上算力少、內存少,並且端上部署須要考慮耗電量的問題。TensorFlow Lite 也針對這些挑戰作出了優化改善,以期將機器學習更容易地在端上進行部署。


TensorFlow Lite 最終實施端口,不只可以部署在安卓和 iOS,還適用於在嵌入式系統(如樹莓派)、硬件加速器(如 Edge TPU)、微控制器(MCU)中。

TensorFlow 正在向微控制器邁進

目前它在圖像分類、對象檢測、姿態估計、語音識別、手勢識別上已經獲得了應用,而 BERT 、風格遷移、語音喚醒等功能也將後續發佈。

如何在 TensorFlow Lite 中部署本身的模型?劉仁杰介紹道,這隻須要按照三個步驟:訓練 TF 模型、轉換到 TF Lite 格式、部署模型到端側設備,根據 TF 2.0 的集成庫,只需很少的代碼調用就可實現。

TensorFlow.js:可製做微信小程序的平臺

TensorFlow.js  是爲 JavaScript 定製的深度學習平臺。能夠運行已有模型、對已有模型進行再訓練、以及訓練新的模型。

工程師介紹 TensorFlow.js  的直播畫面

爲了增長它的實用性,TensorFlow.js 支持多平臺:瀏覽器、無線端(如微信小程序)、服務器、臺式機。除了可在多個平臺運行機器學習模型,還能夠對模型訓練,此外具備 GPU 加速功能,並自動支持 WebGL。

在現場演示中,他們展現了一款基於 TensorFlow.js 的虛擬試裝程序 Modiface 。經過這個框架,打造出了最小最快的虛擬試妝的小程序。據悉,後續還將實現髮型轉換、年齡轉化模擬、膚質檢測等功能。

用 TensorFlow.js  實現虛擬眼鏡搭配小應用

此外,谷歌工程師介紹到,TensorFlow.js 適用的網站、無線端上,擁有大量的機器學習的應用場景,好比加強現實 AR、基於手勢和肢體的交互、語音識別、無障礙網站、語義分析、智能會話、網頁優化。

目前,TensorFlow.js 已經支持圖像分類、物體識別、姿態識別、語音命令識別、文本分類等功能,好比推出的微信小程序插件,使用一個 API 就能夠實現豐富的功能。

  期待谷歌以及 TensorFlow  帶來更多驚喜

除了上述提到的 TensorFlow 的一些功能,還對 Tf.distribute、TensorFlow 優化工具包、以及 TensorFlow 的一些企業應用案例作了介紹。最後,梁信屏再次登臺,分享了 TensorFlow 的社區狀況。

 TensorFlow 的社區中有很多大神用戶

在 TensorFlow 的核心建設上,超過 2135 位貢獻者。有 109 位機器學習領域的谷歌開發者專家;全球範圍內多達 46 個 TensorFlow 用戶羣組。他還詳細介紹了加入 TensorFlow 社區的途徑。

隨着 TensorFlow RoadShow  的結束,谷歌開發者大會也結束了全部日程,圓滿落幕。對全部的技術開發人員來講,這場盛會所帶來的乾貨,應該比觀看蘋果發佈會要直觀的多。

讓咱們期待 TensorFlow 的下一次突破,也但願谷歌可以在 AI 賽道上,更加給力。明年 GDD,咱們再約!

相關文章
相關標籤/搜索