Web與人工智能時代

時間 2019-12-07

原文原文鏈接

內容來源：2017年5月13日，微軟（中國）開發體驗與合做事業部技術顧問佘澤鵬在「HTML夢工場&微軟開發者沙龍第06期」進行《Web與人工智能時代》演講分享。IT大咖說做爲獨家視頻合做方，經主辦方和講者審閱受權發佈。html

閱讀字數: 2781 用時: 14分鐘前端

摘要

「人工智能」一詞最初是在1956年Dartmouth學會上提出的。從那之後，研究者們發展了衆多理論和原理，人工智能的概念也隨之擴展。人工智能（Artificial Intelligence）英文縮寫爲AI。它是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能是計算機科學的一個分支，它企圖瞭解智能的實質，並生產出一種新的能以人類智能類似的方式作出反應的智能機器，該領域的研究包括機器人、語言識別、圖像識別、天然語言處理和專家系統等。人工智能從誕生以來，理論和技術日益成熟，應用領域也不斷擴大，能夠設想，將來人工智能帶來的科技產品，將會是人類智慧的「容器」。

嘉賓演講視頻和PPT地址： t.cn/RNUZmwD

加強人類的智慧

如今人工智能很是火，首先是由於雲計算髮達，提供了強大的計算能力。ios

高強度的算法能夠幫助作到人工智能。算法

人工智能須要大量數據來訓練、規劃，咱們有海量的數據來作人工智能。編程

這是人工智能三股強大的動力。json

MicrosoftGraph是一個開發平臺，它提供了強大的網絡、強大的API，能夠鏈接不一樣的數據、不一樣應用。利用相應平臺的不一樣數據，作到跨設備跨平臺的無縫對接。網絡

AI Infrastructure&Service

微軟在人工智能提供了不一樣的平臺，要把AI帶到每一個人身邊，讓不一樣層次的開發者都能利用微軟技術幫助他們的業務。架構

如圖所示，最底層是硬件的創新，有海量的硬件計算能力。有GPU、scale和FPGA。例如FPGA能夠把相應的算法編成可編程的陣列寫進硬件裏，使計算更高速。機器學習

上一層提供了海量數據的存儲和分析。ide

第三層是Machine Learning的算法，Cognitive Toolkit。提供了開源算法的工具包，研究人員能夠用工具包來寫本身的算法並研究相應的人工智能技術。

Azure Machine Learning Studio是Azure的一項機器學習的服務，服務包含了一些現成算法。經過可視化界面，用拖拉拽的方式就能夠將算法運行起來，也能夠添加Python或者R的腳本。數據科學家只需理解這些算法，但不用本身寫過高難度的算法。

CognitiveService供開發者使用，它是一套API，能夠直接調用。

微軟在不一樣層次提供了相應的服務。

Microsoft AI Portfolio

從另外一個維度來看，微軟人工智能的四大支柱是Agent、Applications、Services、Infrastructure。

Agent：有Cortana和XiaoIce。

Applications：微軟把人工智能技術運用到自家的應用裏，好比office、輸入法、pix和skype等等。

Services：還有像Bot Framework、Cognitive Services、Cognitive Toolkit等相應的Services。

Infrastructure：基礎設施，好比硬件、存儲、分析都屬於Infrastructure，微軟提供了相應的一些基礎設施服務用於機器學習。

Cognitive Services

認知服務是一套REST API，不管是寫Web、Andriod仍是ios，不論是什麼樣的開發者，均可以使用這套REST API來幫助業務或應用服務變得更加智能化。

CognitiveServices主要有五個部分，vision、language、speech、search和knowledge。

在以前的推廣過程當中，咱們發現不少開發者喜歡自定義的東西，因此咱們推出了自定義服務。

好比自定義的視覺服務、自定義智能語言理解服務、自定義語音服務、自定義搜索和自定義決策。

視覺

計算機影像API：上傳一張圖，它能夠識別出圖中的內容。

人臉API：作人臉識別、登陸等操做。

內容審查器：內容合法性識別。

情感API：把人臉分析成八種表情並識別出來，每種表情給出百分比數據。

Video API：對視頻進行防抖處理、動做檢測、人臉追蹤等。

CustomVision Service：自定義計算機視覺服務。

Video Indexer：識別視頻內容、對視頻進行分析。

先進的圖像處理算法可幫助自動審查內容，經過返回人臉、圖像和情緒等智能看法構建更人性化的應用。

Computer Vision

Analyze Image

識別出圖片裏的內容。

OCR

提取圖片中的文字。

它會把圖片的語言、方向、文本的位置都識別出來，能夠作疊加。目前更適合作文本的掃描，全球版還能識別手寫的文字。

Smart Thumbnail

用API作圖片的智能識別。

Face APIs

FaceAPI——Detection

上傳一張人臉圖片，人臉檢測會返回一個json的格式。Json格式包含了人臉的屬性、人臉特徵點的位置。

Face API——Verification

Face API——Group

人臉分組。

FaceAPI——Identify

人臉識別須要先上傳圖片，創建一個庫。之後根據人臉的特徵點就能進行識別。

Emotions APIs

語音

處理應用程序中的語音。

自定義語音服務：在特定場景下，對一些特定詞彙進行調整，提升識別率。

說話人識別API：先訓練幾段語音，在後來上傳語音的時候就能自動進行識別。

Translator語音API：經過語音進行翻譯。

還有必應語音API。

語音API

Voice Recognition Model

語音識別分爲REST和WebSocket兩種方式。Result經過N-Bset的算法計算出來。

Custom Speech自定義語音識別服務

克服語音識別障礙，如說話風格、詞彙和背景噪音。用戶能夠經過調整語音識別器的語言模型，使其匹配應用程序的詞彙和用戶的說話風格，針對本身的場景進行自定義，提升語音識別在特定場景的識別率。

語言

語言理解智能服務（簡稱LUIS, luis.ai）、Web語言模型API、Translator文本API、必應拼寫檢查API、文本分析API、Linguistic Analysis API。

讓應用可以處理天然語言、評估觀點和主題，並瞭解到如何識別用戶需求。

文本分析API

情感分析：該API會在完成分析後返回一個介於0-1之間的分值。接近1的分數表示積極情感，接近0的分數表示消極情感。情感分數是基於分類技術而產生的。分類器的輸入特性包含n-gram，詞性標籤中的特性以及單詞嵌入。目前，支持的語言包括英語、法語、西班牙語和葡萄牙語。

關鍵短語提取：該API會返回一個字符串列表表示輸入文本的要點。咱們採用Microsoft Office的複雜的天然語言處理工具。目前，英語是惟一受支持的語言。

話題檢測：這是一個新發布的API。該API能夠返回在提交的文本中所檢測到的話題。話題是根據一個關鍵短語來肯定的，關鍵短語能夠是一個或者多個相關聯的詞語。該API要求每次提交至少100條文本記錄，能夠幫助你在成千上萬條文本記錄中檢測話題。每一次文本記錄提交均會收取一次API調用費用。該API適用於人類書面編寫的較短的文本，例如評論或用戶反饋等。

語言探測：API會返回探測到的語言以及一個介於0-1之間的數值。數值爲1表示100%肯定探測到的語言種類。目前共支持120種語言。