內容來源:2017年5月13日,微軟(中國)開發體驗與合做事業部技術顧問佘澤鵬在「HTML夢工場&微軟開發者沙龍第06期」進行《Web與人工智能時代》演講分享。IT大咖說做爲獨家視頻合做方,經主辦方和講者審閱受權發佈。html
閱讀字數: 2781 用時: 14分鐘前端
如今人工智能很是火,首先是由於雲計算髮達,提供了強大的計算能力。ios
高強度的算法能夠幫助作到人工智能。算法
人工智能須要大量數據來訓練、規劃,咱們有海量的數據來作人工智能。編程
這是人工智能三股強大的動力。json
MicrosoftGraph是一個開發平臺,它提供了強大的網絡、強大的API,能夠鏈接不一樣的數據、不一樣應用。利用相應平臺的不一樣數據,作到跨設備跨平臺的無縫對接。網絡
微軟在人工智能提供了不一樣的平臺,要把AI帶到每一個人身邊,讓不一樣層次的開發者都能利用微軟技術幫助他們的業務。架構
如圖所示,最底層是硬件的創新,有海量的硬件計算能力。有GPU、scale和FPGA。例如FPGA能夠把相應的算法編成可編程的陣列寫進硬件裏,使計算更高速。機器學習
上一層提供了海量數據的存儲和分析。ide
第三層是Machine Learning的算法,Cognitive Toolkit。提供了開源算法的工具包,研究人員能夠用工具包來寫本身的算法並研究相應的人工智能技術。
Azure Machine Learning Studio是Azure的一項機器學習的服務,服務包含了一些現成算法。經過可視化界面,用拖拉拽的方式就能夠將算法運行起來,也能夠添加Python或者R的腳本。數據科學家只需理解這些算法,但不用本身寫過高難度的算法。
CognitiveService供開發者使用,它是一套API,能夠直接調用。
微軟在不一樣層次提供了相應的服務。
從另外一個維度來看,微軟人工智能的四大支柱是Agent、Applications、Services、Infrastructure。
Agent:有Cortana和XiaoIce。
Applications:微軟把人工智能技術運用到自家的應用裏,好比office、輸入法、pix和skype等等。
Services:還有像Bot Framework、Cognitive Services、Cognitive Toolkit等相應的Services。
Infrastructure:基礎設施,好比硬件、存儲、分析都屬於Infrastructure,微軟提供了相應的一些基礎設施服務用於機器學習。
認知服務是一套REST API,不管是寫Web、Andriod仍是ios,不論是什麼樣的開發者,均可以使用這套REST API來幫助業務或應用服務變得更加智能化。
CognitiveServices主要有五個部分,vision、language、speech、search和knowledge。
在以前的推廣過程當中,咱們發現不少開發者喜歡自定義的東西,因此咱們推出了自定義服務。
好比自定義的視覺服務、自定義智能語言理解服務、自定義語音服務、自定義搜索和自定義決策。
計算機影像API:上傳一張圖,它能夠識別出圖中的內容。
人臉API:作人臉識別、登陸等操做。
內容審查器:內容合法性識別。
情感API:把人臉分析成八種表情並識別出來,每種表情給出百分比數據。
Video API:對視頻進行防抖處理、動做檢測、人臉追蹤等。
CustomVision Service:自定義計算機視覺服務。
Video Indexer:識別視頻內容、對視頻進行分析。
先進的圖像處理算法可幫助自動審查內容,經過返回人臉、圖像和情緒等智能看法構建更人性化的應用。
識別出圖片裏的內容。
提取圖片中的文字。
它會把圖片的語言、方向、文本的位置都識別出來,能夠作疊加。目前更適合作文本的掃描,全球版還能識別手寫的文字。
用API作圖片的智能識別。
上傳一張人臉圖片,人臉檢測會返回一個json的格式。Json格式包含了人臉的屬性、人臉特徵點的位置。
人臉分組。
人臉識別須要先上傳圖片,創建一個庫。之後根據人臉的特徵點就能進行識別。
處理應用程序中的語音。
自定義語音服務:在特定場景下,對一些特定詞彙進行調整,提升識別率。
說話人識別API:先訓練幾段語音,在後來上傳語音的時候就能自動進行識別。
Translator語音API:經過語音進行翻譯。
還有必應語音API。
語音識別分爲REST和WebSocket兩種方式。Result經過N-Bset的算法計算出來。
克服語音識別障礙,如說話風格、詞彙和背景噪音。用戶能夠經過調整語音識別器的語言模型,使其匹配應用程序的詞彙和用戶的說話風格,針對本身的場景進行自定義,提升語音識別在特定場景的識別率。
語言理解智能服務(簡稱LUIS, luis.ai)、Web語言模型API、Translator文本API、必應拼寫檢查API、文本分析API、Linguistic Analysis API。
讓應用可以處理天然語言、評估觀點和主題,並瞭解到如何識別用戶需求。
情感分析:該API會在完成分析後返回一個介於0-1之間的分值。接近1的分數表示積極情感,接近0的分數表示消極情感。情感分數是基於分類技術而產生的。分類器的輸入特性包含n-gram,詞性標籤中的特性以及單詞嵌入。目前,支持的語言包括英語、法語、西班牙語和葡萄牙語。
關鍵短語提取:該API會返回一個字符串列表表示輸入文本的要點。咱們採用Microsoft Office的複雜的天然語言處理工具。目前,英語是惟一受支持的語言。
話題檢測:這是一個新發布的API。該API能夠返回在提交的文本中所檢測到的話題。話題是根據一個關鍵短語來肯定的,關鍵短語能夠是一個或者多個相關聯的詞語。該API要求每次提交至少100條文本記錄,能夠幫助你在成千上萬條文本記錄中檢測話題。每一次文本記錄提交均會收取一次API調用費用。該API適用於人類書面編寫的較短的文本,例如評論或用戶反饋等。
語言探測:API會返回探測到的語言以及一個介於0-1之間的數值。數值爲1表示100%肯定探測到的語言種類。目前共支持120種語言。
Intent,意圖,是指所要表達的意思。
Entites是一個實體,就是裏面的參數。
用戶能夠經過自定義意圖和實體,在用戶的場景下實現定製化的語音理解服務,通常能夠與Bot Framework結合,實現智能客服的場景。
QnAMaker,這個服務能夠快速生成一個可以回答FAQ問題的智能客服機器人。
詳細規劃複雜的信息和數據,以解決智能推薦和語義搜索等任務。
經過必應搜索API使你的應用、網頁和其它體驗功能更加智能、更具吸引力。
發掘探索最新的認知服務技術。在認知服務正式發佈以前,能夠在這裏探索、嘗試新的認知服務技術,並提供反饋。
人工智能須要大量數據,最重要的是如何去獲取這些數據。Microsoft Graph容許用戶使用組織內的數據來推進人工智能的轉型。它藉助office36五、必應這些數據和外界數據的結合,與業務系統結合,打造出不少智能應用和服務。
我今天的演講就到這裏,謝謝你們。