人工智能產業鏈瞭解

   「全面化人工智能可能意味着人類的終結...」機器能夠自行啓動,而且自動對自身進行從新設計,速率也會愈來愈快。受到漫長的生物進化歷程的限制,人類沒法與之競爭,終將被取代「 算法

---  by史蒂芬·霍金安全

人早晚會用機器把本身從大量重複性的工做中解放出來,可是實現這個願望並不須要那些鼓吹的最終版本「超級智能」。框架

AI的業務2018年快速崛起,對其中的技術框架,產業信息須要瞭解。機器學習

 

簡介

ML(machine learning):即機器學習,wiki定義:「計算機系統以來科學的預測和判斷模型去有效完成特定的任務,而無需藉助明確的執行指令」,屬於AI的一個分支,機器學習算法的重點在於經過「訓練數據」來實現合理的預判決策,擺脫對固定明確的執行指令的依賴。工具

AI(artificial intelligence):即人工智能,wiki定義:「機器能夠經過察覺環境,採起最大成功機率的行動,去達到特定的目標」,更通俗的定義是「機器/計算機,經過對外部輸入數據的理解和學習,自適應的去解決特定的問題,表現出相似天然人的學習能力,問題分析和解決能力」。佈局

AI不是單一的學科技術,是跨行業,跨學科的。它主要包含四大核心技術:學習

  • 機器學習:經過大量數據訓練,作最佳決策和預測;
  • 天然語言處理:人類語言和計算機可處理的形式之間的相互轉換,能夠是文字也能夠是聲音,主要有信息檢索,信息提取,語音識別,詞性標註等等;
  • 圖像處理:相似人類的圖像識別功能,能夠識別圖像和多維數據,主要有圖像過濾,特徵提取等;
  • 人機交互:計算機經過人機交互界面和人進行交流,好比VR,加強現實等技術;

 

技術框架及分析

image

顯而易見,「數據」是企業很是重要的一種資產,是後續智能賴以生存和發展的基礎。大數據

數據相關目前有如下幾種業務:flex

數據採集(data acquisition),按照必定規則和訴求,收集原始數據,國內有火車頭,瑞雪採集,神箭手等採集工具,能夠經過用戶配置的規則進行數據採集,這個產業中可能會有大量的隱私數據,涉及用戶敏感信息的數據被轉手交易,在用戶徹底不知情的狀況下被使用,因此我的以爲後面數據的隱私安全也是一個方向;ui

數據清洗(data cleaning),從大量數據中篩選矯正,剔除那些過時的,異常的的值;

數據挖掘(data mining),經過算法實現對海量數據的分析和建模,從數據中發現規律;

數據標註(data annotation),目前來看「有多少智能,就有多少人工」,智能以來的數據輸入,須要通過標註處理。舉個例子:要想訓練一個識別可樂罐的算法,前期就須要輸入大量的,各類各樣帶有可樂罐的圖片,而且把其中可樂罐的位置標註出來,在大量數據需求面前, 這個工做量很是龐大,有很多公司專門作數據標註的業務。這個方向後面會逐漸的被自動化工具所替代。

 

數據以上,雲計算/大數據/GPU/各類IC,甚至5G等等,這類通用的技術支撐,不只在人工智能的產業鏈中扮演重要角色,在將來「萬物互聯」的環境中,都將做爲主要支撐層,已經不會是傳統意義上的「技術」,更像是一種社會不可或缺的基礎設施。因此不管是阿里仍是華爲,他們都不只僅是表面上的「淘寶天貓」和「智能手機」,更重要的是背後的飛天,盤古,HISI等這些東西。而且,「中興事件」上能夠看出,芯片級別的優點,做爲行業上游的優點,能夠對下面的集成商,開發商,構成很大的威脅。

基礎通用技術這層,不是什麼公司均可以玩的起,須要比較早的規劃和技術儲備。

這就像技術人員爲何老是往底層走,更底層不必定表明更高的收入,但更底層每每更安全。

 

再往上,就是通用的一些計算/算法框架, 通用的算法技術。

框架以TensorFlow爲例,官方解釋以下:

TensorFlowis an open source software library for high performance numerical computation. Its flexible architecture allows easy deployment of computation across a variety of platforms (CPUs, GPUs, TPUs), and from desktops to clusters of servers to mobile and edge devices.

框架,到通用技術,能夠理解爲一個抽象封裝層析,到另外一個更高的抽象封裝層次。

爲了應對上層紛繁的業務層快速迭代,快速集成,快速發佈貼近用戶具體場景的開發需求。

 

再上一層,也就是頂層,能夠叫作「應用層」了。

所謂的「應用」,就是「業務」,也就是「業務代碼」的那個「業務」。具體講,就是各個細分行業中不一樣的用戶需求和業務流程。主要開發工做在這個分層的公司,嚴格意義上將不能叫技術公司,更多的是業務的迭代集成和二次開發,技術深度和投入上都有侷限,通用性上也受侷限。

 

最後,收集下AI產業鏈中公司的分佈。

全球:

image

國內:

image

 

BAT佈局:

image

相關文章
相關標籤/搜索