人工智能有多火每一個人的內心應該很清楚,因此在這裏再也不闡述。 不少科技公司把將來幾年的賭注壓在了AI身上-「all in AI「,同時也有數不清楚的公司正在準備轉型AI,另外也有不少公司雖然跟AI沾不上任何邊但喊着AI口號來吸引關注。 總而言之,AI會變得愈來愈火,會有更多的人才走進這個大軍裏。
在AI轉型的進程中,並不必定是一路順風的,甚至會很艱難。不知有多少人關注過人工智能項目的失敗率? 20%? 30%? .. 或者 50%?? 可能想得太簡單,據不徹底統計一個數據類項目的失敗率達到了85%以上! 其實這也不奇怪,現階段,一個通常IT類項目的失敗率也是50%以上呢,況且AI項目....
算法
因此,不少狀況下投入實施AI項目自己是風險,就看你有沒有足夠的風控能力,最後能把項目成功落地,而且產生價值! 那爲何會有大部分AI項目以失敗爲了結呢?人的問題? 不必定! 可能的主要緣由包括: 1. 解決了錯誤的問題,或者把僞需求當成了真需求 2. 選擇了算法解決不了的問題... 等等。機器學習
在這篇文章裏,咱們總結出了六條原則,這些原則對於實施一個成功AI項目來講尤爲重要。對於這些原則咱們也參考了 [1]。佈局
人工智能最大的價值是什麼? 是能夠幫你作決策! 那爲了作這種決策須要什麼條件? 必需要有數據! 沒有數據,人工智能只是空談。因此第一點就是要弄清楚是否是切入AI的最好的時機或者是大力推動AI的最好的時機。學習
一個AI項目的技術流程是:搭建數據蒐集系統->數據收集->清洗->AI... 若是一個公司尚未那麼多數據必須由機器來分析,那這時候能夠作兩件事情:1. 提早想好將來應用場景,佈局數據的蒐集工做 2. 先專一把業務作好,AI事情以後再看。總而言之,數據是AI的基礎,若是沒有數據,那首先得想辦法生成或者蒐集數據,而不是直接跳進這個「坑」,而後拖累了其餘的業務。測試
其實這種例子很多見。尤爲是對AI瞭解不深的高管或者策略者,常常急於這些「錦上添花」的事情,反而在本身須要發力的戰場上卻沒能作出成果。 因此對於第一個原則,要不斷問本身:咱們有足夠的數據嗎? 如今是合適的時機嗎? 現階段作什麼才能一年以後才能把AI技術提高到公司的戰略層面?人工智能
機器學習,深度學習是AI領域的流行詞,聽起來高大上。在學校裏,學術界甚至在各種比賽中,咱們習慣於技術思惟 - 「我有很厲害的技術,我要作XXX項目」。其實找對問題是最重要的,這是一我的最高級別的技能。愛因斯坦等科學家爲何會這麼成功? 聰明只是一方面,核心是他們可以找到一個「好」的問題! 爲何美國不少博士生6,7年也畢業不了?難道他們由於笨嗎? 其實否則,就是由於找不出合適的問題! 因此,找一個正確的問題能夠說是AI項目成功的一半。設計
那怎麼去找到正確的問題呢? 這是一個沒有正確答案的問題,但其本質是找出業務中的痛點。如下幾點能夠做爲參考:cdn
1. 首先要理解業務,不是跟別人聊聊就好了,必定要深刻。好比如今負責的業務是智能客服,那就在一線當幾天客服再來談接下來怎麼作! 若是隻是跟客服負責人簡單坐下來喝個咖啡聊一下,以爲能聊出真正的痛點嗎? 因此,做爲AI項目的負責人,必定要對業務敏感,試圖從業務人員的視角去了解。 現階段,從事AI的人彷彿會有種優越感,很難踏實地去了解業務,致使閉門造車,最後其實也沒什麼成果。
2. 瞭解競爭對手在作什麼,他們在哪些事情上已經取得了成果。知已知比是商業界很重要的一點,要時刻了解別人在作什麼。若是他們在某一個領域已經驗證出成功的案例出來,那這正是對你來講很好的參考。
AI是一個很是開放的領域,即使對於一個業務,咱們可能想出各類各樣的問題。但須要記住的一點是:任何的AI項目必然是一個長期的工程,它所帶來的成本也是比較大的。因此必需要有個優先級。假設咱們面臨三個選擇,項目1,項目2和項目3,首先須要作哪一個? 選擇最有意思的? 選擇最優挑戰性的? 仍是選擇我最感興趣的技術相關的? 別,千萬不要這麼作....進程
在實施AI項目的時候優先級最高的仍是對業務影響最大的那一類項目。換個角度能夠想想,公司裏的哪一個業務由於效率低而每天被罵? 那一批人天天作着重複性的工做但卻花費大量的成本? 產品中的哪個環節的體驗最很差?ip
咱們能夠從這些痛點中出發,先把最「痛」的且「能夠AI」化的項目列出來,而後再粗略算一下,項目預期所帶來的價值或者對業務上的提高。那這部分價值怎麼計算?這方面要部分依賴於對AI技術的理解,好比如今有一個系統A,但將來3個月開發出了一個算法以後,可以提高多少的效率? 另外,也能夠去參考一些領域內成功案例,實在不行就去看看論文裏的結果,固然這裏的結果能夠做爲最高能夠達到的預期結果。
還有一種方法是,想出一個最簡單的路徑來快速嘗試。好比一個創業公司想推出一個機器客服系統,那搭建這種系統必然會耗時長。那這時候怎麼快速驗證? 咱們徹底能夠先以人工的方式來操做(客戶覺得是機器),並觀察用戶的反饋,若是這樣的方式確實可行,那基本上內心也會有數。因此這個階段,要想出各類捷徑或者「做弊」的手段來快速測試並找出最合適的項目。
AI就像3,4歲的孩子,它的能力是有限的,它不可能用來解決任何問題。對於一些問題它的做用確實比較大好比人臉識別,圖像識別,物體檢測等。但對於另一些問題做用未必明顯,或者投入產出比很低,好比經過AI去預測A股的價格,或者想作一款什麼均可以回答的智能機器人。
能夠把利用AI預測A股股價做爲例子(美股沒有預測過,因此不敢在這裏評論),這個目前很難作到。爲何?股價自己是要依賴於人性的,同時也依賴於其餘非價格類因素,那這些信息顯然很難在咱們接觸到的股市數據中得到。或許有些人會說,那咱們能夠去分析人的行爲啊,而後把它做爲信號不就好了嗎? 固然能夠,這也是下面我列的第三點。但即使如此,A股的這種不肯定性使得目前的AI系統很難去提供準確地預測。
爲了作出這樣的決策,必需要對技術的前沿知識很是敏感。只有這樣才能作到評估: 1. 這項目到底能不能作? 可行性怎麼樣? 2. 這項目作完以後預計提高有多少,這個提高帶來的好處跟成本相比會是怎樣? 3. 若是想讓目前項目具備可行性,須要具有哪些條件?或者哪些數據? 爲了擁有這些條件接下來規劃是怎麼樣的?
AI項目的核心是迭代,不斷試錯的過程。這點須要跟產品經理還有開發人員要達成一致。那爲了更好的迭代,須要去想一個迭代的路徑,也就是什麼樣的迭代方法讓產品更快速地達到咱們想要的效果?這裏面的學問不少,產品怎麼設計才能更好的得到反饋? 數據怎麼收集?等等。
一個AI項目若是超過3個月看不到效果是比較危險的,爲何這麼說? 由於還沒看到任何效果等同於尚未任何的迭代。迭代思路其實跟MVP(minimum value product)的思路很是相近,並且這個思路也跟強化學習(reinforcement learning)比較相近。
迭代自己分紅兩個部分,一個是整個項目的快速迭代, 還有一個是每個項目模塊內的快速迭代。咱們能夠以建模來打個比方,好比咱們在建模時第一個要搭建的模型叫作baseline,那什麼叫baseline? 邏輯迴歸? SVM? 在我眼裏,baseline 就是一天內能作出來的模型!無論數據有多大,場景多複雜,一天內須要看到一個最簡單的結果。數據不少怎麼辦? 那就採樣一部分; 數據太髒怎麼辦? 那就把髒數據先去掉;資源不夠怎麼辦? 那就用邏輯迴歸這種簡單模型! 其實總有辦法能夠在最短期內弄出一個可運行的模型,並經過此結果來評估項目的可行性以及將來預期的效果。 這些數據對於後續項目的實施尤爲關鍵。另外,讓別人儘快看到結果也會增長對你的信任,否則以後的工做會很是被動。
咱們在建模的時候一般會考慮一些「AI型」指標,好比AUC,F1-score等,這些應該不少人很是熟悉。那這裏的問題是,這些指標越高,對業務的價值就會越高嗎? 其實不必定! 從業務的角度評估和從模型的角度評估不必定是徹底正比關係的。但至少確定是有相似正比關係,否則採用這些指標是沒有意義的! 因此做爲AI人員也須要關注業務部門關心的指標,來思考什麼樣的模型狀態最適合當前的業務情況。
另外,在不少場景下對於模型的解釋也是比較重要的。特別是對於金融,教育這類的場景。咱們但願可以在部署前有對這些模型的理解,好比一個模型犯錯誤,理解爲何? 這也是目前深度學習的弊端-比較差的可解釋性。
參考: