85%的AI項目以失敗了結，切記這6條成功原則！

時間 2019-11-07

原文原文鏈接

人工智能有多火每一個人的內心應該很清楚，因此在這裏再也不闡述。 不少科技公司把將來幾年的賭注壓在了AI身上-「all in AI「，同時也有數不清楚的公司正在準備轉型AI，另外也有不少公司雖然跟AI沾不上任何邊但喊着AI口號來吸引關注。總而言之，AI會變得愈來愈火，會有更多的人才走進這個大軍裏。

在AI轉型的進程中，並不必定是一路順風的，甚至會很艱難。不知有多少人關注過人工智能項目的失敗率？ 20%？ 30%？ .. 或者 50%？？可能想得太簡單，據不徹底統計一個數據類項目的失敗率達到了85%以上！其實這也不奇怪，現階段，一個通常IT類項目的失敗率也是50%以上呢，況且AI項目....
算法

因此，不少狀況下投入實施AI項目自己是風險，就看你有沒有足夠的風控能力，最後能把項目成功落地，而且產生價值！ 那爲何會有大部分AI項目以失敗爲了結呢？人的問題？不必定！可能的主要緣由包括: 1. 解決了錯誤的問題，或者把僞需求當成了真需求 2. 選擇了算法解決不了的問題... 等等。機器學習

在這篇文章裏，咱們總結出了六條原則，這些原則對於實施一個成功AI項目來講尤爲重要。對於這些原則咱們也參考了 [1]。佈局

1. 弄清楚是不是合適的時機？

人工智能最大的價值是什麼？是能夠幫你作決策！那爲了作這種決策須要什麼條件？必需要有數據！沒有數據，人工智能只是空談。因此第一點就是要弄清楚是否是切入AI的最好的時機或者是大力推動AI的最好的時機。學習

一個AI項目的技術流程是：搭建數據蒐集系統->數據收集->清洗->AI... 若是一個公司尚未那麼多數據必須由機器來分析，那這時候能夠作兩件事情：1. 提早想好將來應用場景，佈局數據的蒐集工做 2. 先專一把業務作好，AI事情以後再看。總而言之，數據是AI的基礎，若是沒有數據，那首先得想辦法生成或者蒐集數據，而不是直接跳進這個「坑」，而後拖累了其餘的業務。測試

其實這種例子很多見。尤爲是對AI瞭解不深的高管或者策略者，常常急於這些「錦上添花」的事情，反而在本身須要發力的戰場上卻沒能作出成果。因此對於第一個原則，要不斷問本身：咱們有足夠的數據嗎？如今是合適的時機嗎？現階段作什麼才能一年以後才能把AI技術提高到公司的戰略層面？人工智能

2. 選擇正確的問題比使用哪一項技術更重要

機器學習，深度學習是AI領域的流行詞，聽起來高大上。在學校裏，學術界甚至在各種比賽中，咱們習慣於技術思惟 - 「我有很厲害的技術，我要作XXX項目」。其實找對問題是最重要的，這是一我的最高級別的技能。愛因斯坦等科學家爲何會這麼成功？聰明只是一方面，核心是他們可以找到一個「好」的問題！爲何美國不少博士生6，7年也畢業不了？難道他們由於笨嗎？其實否則，就是由於找不出合適的問題！因此，找一個正確的問題能夠說是AI項目成功的一半。設計

那怎麼去找到正確的問題呢？這是一個沒有正確答案的問題，但其本質是找出業務中的痛點。如下幾點能夠做爲參考：cdn

1. 首先要理解業務，不是跟別人聊聊就好了，必定要深刻。好比如今負責的業務是智能客服，那就在一線當幾天客服再來談接下來怎麼作！若是隻是跟客服負責人簡單坐下來喝個咖啡聊一下，以爲能聊出真正的痛點嗎？因此，做爲AI項目的負責人，必定要對業務敏感，試圖從業務人員的視角去了解。現階段，從事AI的人彷彿會有種優越感，很難踏實地去了解業務，致使閉門造車，最後其實也沒什麼成果。

2. 瞭解競爭對手在作什麼，他們在哪些事情上已經取得了成果。知已知比是商業界很重要的一點，要時刻了解別人在作什麼。若是他們在某一個領域已經驗證出成功的案例出來，那這正是對你來講很好的參考。

3. 設定好項目的優先級

AI是一個很是開放的領域，即使對於一個業務，咱們可能想出各類各樣的問題。但須要記住的一點是：任何的AI項目必然是一個長期的工程，它所帶來的成本也是比較大的。因此必需要有個優先級。假設咱們面臨三個選擇，項目1，項目2和項目3，首先須要作哪一個？選擇最有意思的？選擇最優挑戰性的？仍是選擇我最感興趣的技術相關的？別，千萬不要這麼作....進程

在實施AI項目的時候優先級最高的仍是對業務影響最大的那一類項目。換個角度能夠想想，公司裏的哪一個業務由於效率低而每天被罵？那一批人天天作着重複性的工做但卻花費大量的成本？產品中的哪個環節的體驗最很差？ip

咱們能夠從這些痛點中出發，先把最「痛」的且「能夠AI」化的項目列出來，而後再粗略算一下，項目預期所帶來的價值或者對業務上的提高。那這部分價值怎麼計算？這方面要部分依賴於對AI技術的理解，好比如今有一個系統A，但將來3個月開發出了一個算法以後，可以提高多少的效率？另外，也能夠去參考一些領域內成功案例，實在不行就去看看論文裏的結果，固然這裏的結果能夠做爲最高能夠達到的預期結果。

還有一種方法是，想出一個最簡單的路徑來快速嘗試。好比一個創業公司想推出一個機器客服系統，那搭建這種系統必然會耗時長。那這時候怎麼快速驗證？咱們徹底能夠先以人工的方式來操做（客戶覺得是機器），並觀察用戶的反饋，若是這樣的方式確實可行，那基本上內心也會有數。因此這個階段，要想出各類捷徑或者「做弊」的手段來快速測試並找出最合適的項目。

4. 理解技術的上限，不要覺得AI什麼均可以解決

AI就像3，4歲的孩子，它的能力是有限的，它不可能用來解決任何問題。對於一些問題它的做用確實比較大好比人臉識別，圖像識別，物體檢測等。但對於另一些問題做用未必明顯，或者投入產出比很低，好比經過AI去預測A股的價格，或者想作一款什麼均可以回答的智能機器人。

能夠把利用AI預測A股股價做爲例子（美股沒有預測過，因此不敢在這裏評論），這個目前很難作到。爲何？股價自己是要依賴於人性的，同時也依賴於其餘非價格類因素，那這些信息顯然很難在咱們接觸到的股市數據中得到。或許有些人會說，那咱們能夠去分析人的行爲啊，而後把它做爲信號不就好了嗎？固然能夠，這也是下面我列的第三點。但即使如此，A股的這種不肯定性使得目前的AI系統很難去提供準確地預測。

爲了作出這樣的決策，必需要對技術的前沿知識很是敏感。只有這樣才能作到評估： 1. 這項目到底能不能作？可行性怎麼樣？ 2. 這項目作完以後預計提高有多少，這個提高帶來的好處跟成本相比會是怎樣？ 3. 若是想讓目前項目具備可行性，須要具有哪些條件？或者哪些數據？爲了擁有這些條件接下來規劃是怎麼樣的？

5. 快速迭代，持續迭代

AI項目的核心是迭代，不斷試錯的過程。這點須要跟產品經理還有開發人員要達成一致。那爲了更好的迭代，須要去想一個迭代的路徑，也就是什麼樣的迭代方法讓產品更快速地達到咱們想要的效果？這裏面的學問不少，產品怎麼設計才能更好的得到反饋？數據怎麼收集？等等。

一個AI項目若是超過3個月看不到效果是比較危險的，爲何這麼說？由於還沒看到任何效果等同於尚未任何的迭代。迭代思路其實跟MVP(minimum value product)的思路很是相近，並且這個思路也跟強化學習（reinforcement learning）比較相近。

迭代自己分紅兩個部分，一個是整個項目的快速迭代，還有一個是每個項目模塊內的快速迭代。咱們能夠以建模來打個比方，好比咱們在建模時第一個要搭建的模型叫作baseline，那什麼叫baseline? 邏輯迴歸？ SVM？在我眼裏，baseline 就是一天內能作出來的模型！無論數據有多大，場景多複雜，一天內須要看到一個最簡單的結果。數據不少怎麼辦？那就採樣一部分；數據太髒怎麼辦？那就把髒數據先去掉；資源不夠怎麼辦？那就用邏輯迴歸這種簡單模型！其實總有辦法能夠在最短期內弄出一個可運行的模型，並經過此結果來評估項目的可行性以及將來預期的效果。這些數據對於後續項目的實施尤爲關鍵。另外，讓別人儘快看到結果也會增長對你的信任，否則以後的工做會很是被動。

6. 項目上線前要作好業務評估

咱們在建模的時候一般會考慮一些「AI型」指標，好比AUC，F1-score等，這些應該不少人很是熟悉。那這裏的問題是，這些指標越高，對業務的價值就會越高嗎？其實不必定！從業務的角度評估和從模型的角度評估不必定是徹底正比關係的。但至少確定是有相似正比關係，否則採用這些指標是沒有意義的！ 因此做爲AI人員也須要關注業務部門關心的指標，來思考什麼樣的模型狀態最適合當前的業務情況。

另外，在不少場景下對於模型的解釋也是比較重要的。特別是對於金融，教育這類的場景。咱們但願可以在部署前有對這些模型的理解，好比一個模型犯錯誤，理解爲何？這也是目前深度學習的弊端-比較差的可解釋性。

參考：

[1] towardsdatascience.com/6-uncommon-…