Web與人工智能時代


內容來源:2017年5月13日,微軟(中國)開發體驗與合做事業部技術顧問佘澤鵬在「HTML夢工場&微軟開發者沙龍第06期」進行《Web與人工智能時代》演講分享。IT大咖說做爲獨家視頻合做方,經主辦方和講者審閱受權發佈。html

閱讀字數: 2781 用時: 14分鐘前端


摘要

「人工智能」一詞最初是在1956年Dartmouth學會上提出的。從那之後,研究者們發展了衆多理論和原理,人工智能的概念也隨之擴展。人工智能(Artificial Intelligence)英文縮寫爲AI。它是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能是計算機科學的一個分支,它企圖瞭解智能的實質,並生產出一種新的能以人類智能類似的方式作出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、天然語言處理和專家系統等。人工智能從誕生以來,理論和技術日益成熟,應用領域也不斷擴大,能夠設想,將來人工智能帶來的科技產品,將會是人類智慧的「容器」。

嘉賓演講視頻和PPT地址: t.cn/RNUZmwD

加強人類的智慧

如今人工智能很是火,首先是由於雲計算髮達,提供了強大的計算能力。ios

高強度的算法能夠幫助作到人工智能。算法

人工智能須要大量數據來訓練、規劃,咱們有海量的數據來作人工智能。編程

這是人工智能三股強大的動力。json

MicrosoftGraph是一個開發平臺,它提供了強大的網絡、強大的API,能夠鏈接不一樣的數據、不一樣應用。利用相應平臺的不一樣數據,作到跨設備跨平臺的無縫對接。網絡

AI Infrastructure&Service

微軟在人工智能提供了不一樣的平臺,要把AI帶到每一個人身邊,讓不一樣層次的開發者都能利用微軟技術幫助他們的業務。架構


如圖所示,最底層是硬件的創新,有海量的硬件計算能力。有GPU、scale和FPGA。例如FPGA能夠把相應的算法編成可編程的陣列寫進硬件裏,使計算更高速。機器學習

上一層提供了海量數據的存儲和分析。ide

第三層是Machine Learning的算法,Cognitive Toolkit。提供了開源算法的工具包,研究人員能夠用工具包來寫本身的算法並研究相應的人工智能技術。

Azure Machine Learning Studio是Azure的一項機器學習的服務,服務包含了一些現成算法。經過可視化界面,用拖拉拽的方式就能夠將算法運行起來,也能夠添加Python或者R的腳本。數據科學家只需理解這些算法,但不用本身寫過高難度的算法。

CognitiveService供開發者使用,它是一套API,能夠直接調用。

微軟在不一樣層次提供了相應的服務。

Microsoft AI Portfolio

從另外一個維度來看,微軟人工智能的四大支柱是Agent、Applications、Services、Infrastructure。

Agent:有Cortana和XiaoIce。

Applications:微軟把人工智能技術運用到自家的應用裏,好比office、輸入法、pix和skype等等。

Services:還有像Bot Framework、Cognitive Services、Cognitive Toolkit等相應的Services。

Infrastructure:基礎設施,好比硬件、存儲、分析都屬於Infrastructure,微軟提供了相應的一些基礎設施服務用於機器學習。

Cognitive Services

認知服務是一套REST API,不管是寫Web、Andriod仍是ios,不論是什麼樣的開發者,均可以使用這套REST API來幫助業務或應用服務變得更加智能化。

CognitiveServices主要有五個部分,vision、language、speech、search和knowledge。

在以前的推廣過程當中,咱們發現不少開發者喜歡自定義的東西,因此咱們推出了自定義服務。

好比自定義的視覺服務、自定義智能語言理解服務、自定義語音服務、自定義搜索和自定義決策。

視覺

計算機影像API:上傳一張圖,它能夠識別出圖中的內容。

人臉API:作人臉識別、登陸等操做。

內容審查器:內容合法性識別。

情感API:把人臉分析成八種表情並識別出來,每種表情給出百分比數據。

Video API:對視頻進行防抖處理、動做檢測、人臉追蹤等。

CustomVision Service:自定義計算機視覺服務。

Video Indexer:識別視頻內容、對視頻進行分析。

先進的圖像處理算法可幫助自動審查內容,經過返回人臉、圖像和情緒等智能看法構建更人性化的應用。

Computer Vision

Analyze Image

識別出圖片裏的內容。


OCR

提取圖片中的文字。


它會把圖片的語言、方向、文本的位置都識別出來,能夠作疊加。目前更適合作文本的掃描,全球版還能識別手寫的文字。

Smart Thumbnail

用API作圖片的智能識別。


Face APIs

FaceAPI——Detection

上傳一張人臉圖片,人臉檢測會返回一個json的格式。Json格式包含了人臉的屬性、人臉特徵點的位置。

Face API——Verification


Face API——Group

人臉分組。


FaceAPI——Identify

人臉識別須要先上傳圖片,創建一個庫。之後根據人臉的特徵點就能進行識別。


Emotions APIs

語音

處理應用程序中的語音。

自定義語音服務:在特定場景下,對一些特定詞彙進行調整,提升識別率。

說話人識別API:先訓練幾段語音,在後來上傳語音的時候就能自動進行識別。

Translator語音API:經過語音進行翻譯。

還有必應語音API。

語音API

Voice Recognition Model

語音識別分爲REST和WebSocket兩種方式。Result經過N-Bset的算法計算出來。


Custom Speech自定義語音識別服務

克服語音識別障礙,如說話風格、詞彙和背景噪音。用戶能夠經過調整語音識別器的語言模型,使其匹配應用程序的詞彙和用戶的說話風格,針對本身的場景進行自定義,提升語音識別在特定場景的識別率。


語言

語言理解智能服務(簡稱LUIS, luis.ai)、Web語言模型API、Translator文本API、必應拼寫檢查API、文本分析API、Linguistic Analysis API。

讓應用可以處理天然語言、評估觀點和主題,並瞭解到如何識別用戶需求。

文本分析API

情感分析:該API會在完成分析後返回一個介於0-1之間的分值。接近1的分數表示積極情感,接近0的分數表示消極情感。情感分數是基於分類技術而產生的。分類器的輸入特性包含n-gram,詞性標籤中的特性以及單詞嵌入。目前,支持的語言包括英語、法語、西班牙語和葡萄牙語。

關鍵短語提取:該API會返回一個字符串列表表示輸入文本的要點。咱們採用Microsoft Office的複雜的天然語言處理工具。目前,英語是惟一受支持的語言。

話題檢測:這是一個新發布的API。該API能夠返回在提交的文本中所檢測到的話題。話題是根據一個關鍵短語來肯定的,關鍵短語能夠是一個或者多個相關聯的詞語。該API要求每次提交至少100條文本記錄,能夠幫助你在成千上萬條文本記錄中檢測話題。每一次文本記錄提交均會收取一次API調用費用。該API適用於人類書面編寫的較短的文本,例如評論或用戶反饋等。

語言探測:API會返回探測到的語言以及一個介於0-1之間的數值。數值爲1表示100%肯定探測到的語言種類。目前共支持120種語言。

Language Understanding Intelligent Service

人類要表達一個意思,有好幾種說話方式。Language Uderstanding Intelligent Service就是要讓計算機也可以理解人類用不一樣方式表達出的同一個意思。

Intent,意圖,是指所要表達的意思。

Entites是一個實體,就是裏面的參數。


用戶能夠經過自定義意圖和實體,在用戶的場景下實現定製化的語音理解服務,通常能夠與Bot Framework結合,實現智能客服的場景。

QnAMaker,這個服務能夠快速生成一個可以回答FAQ問題的智能客服機器人。

知識

詳細規劃複雜的信息和數據,以解決智能推薦和語義搜索等任務。

搜索

經過必應搜索API使你的應用、網頁和其它體驗功能更加智能、更具吸引力。

實驗室項目

發掘探索最新的認知服務技術。在認知服務正式發佈以前,能夠在這裏探索、嘗試新的認知服務技術,並提供反饋。

Redefining Microsoft with AI


人工智能須要大量數據,最重要的是如何去獲取這些數據。Microsoft Graph容許用戶使用組織內的數據來推進人工智能的轉型。它藉助office36五、必應這些數據和外界數據的結合,與業務系統結合,打造出不少智能應用和服務。

我今天的演講就到這裏,謝謝你們。

相關文章
相關標籤/搜索