像數據科學家同樣思考:12步指南(下)

第三-完成

一旦產品構建完成,你仍然須要作一些事情來使項目更加成功並使你的將來生活更輕鬆。那麼咱們如何完成數據科學項目呢?數據庫

10-交付

完成階段的第一步是產品交付。爲了建立能夠交付給客戶的有效產品,首先必須瞭解客戶的觀點。其次,你須要選擇最佳的方式將項目成果反饋給客戶。最後,你必須選擇要包含在產品中的信息和結果以及要放棄的內容。在產品建立和交付過程當中作出好的選擇能夠大大提升項目的成功機會。編程

溝通媒介能夠採起多種形式。在數據科學中,產品最重要的一個方面是客戶是否積極參與產品而且可以使用產品來回答多種可能的問題。具體的溝通媒介有不少方式:數組

·       向客戶提交結果多是最簡單的選項,其中包括文本、表格、圖表和其餘信息,這些信息能夠解決你的項目要回答的部分或所有問題。編程語言

·       在一些數據科學項目中,數據集的分析和結果也可用項目原始數據範圍以外的數據,其中可能包括原始數據生成的數據、其餘不一樣來源的相似數據、或因爲某種緣由還沒有分析的其餘數據。在這種狀況下,若是你能夠爲客戶建立能夠執行分析新數據集並生成結果的分析工具,對客戶有所幫助。同時客戶能夠有效地使用此分析工具,並繼續在未來和各類(但相似的)數據集中回答他們的主要問題,這是最好的狀況。工具

·       若是你想提供比分析工具更好的產品,你可能須要構建某種類型的完整的應用程。若是你正在考慮提供交互式圖形應用程序,那麼你必須設計,構建和部署它。一般,這些都不是一項小任務。若是你但願應用程序具備許多功能而且具備靈活性,那麼設計它並構建它將變得更加困難。學習

除了決定提供結果的媒介外,你還必須決定它將包含哪些結果。有些結果和內容多是包含的明顯選擇,但對於其餘信息位,可能不那麼明顯。一般,你但願包含儘量多的有用信息和儘量多的結果,但你但願避免客戶可能誤解或誤用你選擇包含的結果。在許多狀況下,這能夠是微妙的平衡,而且它在很大程度上取決於具體項目以及客戶和其餘人對結果的知識和經驗。spa

11-進行修訂

產品交付後,咱們會在初步反饋後繼續修改產品。一旦客戶開始使用該產品,就有可能出現一系列全新的問題。儘管你付出了最大努力,但你可能沒有預料到客戶使用產品的方式的各個方面。即便產品完成了它應該作的事情,你的客戶和用戶也可能不會作這些事情而且有效地完成這些工做。設計

一般很難從客戶、用戶或其餘任何人那裏得到建設性的反饋。所以一些數據科學家提供完產品後就會忘記它們,一些數據科學家提供產品後會選擇等待客戶提供反饋。進行產品修訂可能會很是棘手,找到合適的解決方案和實施策略取決於你遇到的問題類型以及你須要更改以解決問題的方法。若是在整個項目過程當中,你始終保持對不肯定性和許多可能結果的認識,那麼你發現本身如今面臨的結果與你以前預期的結果不一樣可能就不足爲奇了。可是,若是你一直勤奮,問題很小,修復相對容易。調試

一旦你發現產品出現問題並弄清楚如何修復產品,仍然須要決定是否修復產品。一些人最初的傾向是每一個問題都須要解決,這不必定是真的。若是有理由能夠說服你不想進行修復問題,那就須要慎重考慮了,由於若是選擇盲目地修復發現的每一個問題,那必定會花費大量的時間和精力。blog

12-結束項

數據科學過程的最後一步是將其包裝起來。隨着數據科學項目的結束,彷佛全部的工做都已完成,剩下的就是修復任何剩餘的錯誤,而後才能徹底中止思考並繼續下一個。但在完成項目調試以前,你能夠採起一些措施來增長將來成功的機會,不管是擴展同一個項目仍是徹底不一樣的項目。

如今有兩種方法能夠增長你將來成功的機會。一種方法是確保在未來的任什麼時候候你均可以輕鬆地再次獲取該項目並重作、擴展或修改它。經過這樣作,你將增長在後續項目中得到成功的機會,因此,你須要從如今開始開始挖掘項目材料和代碼並記下你用什麼作的或者你是怎麼作到的。最實用的方法是經過文檔存儲

提升將來項目成功率的第二種方法是儘量多地從這個項目中學習,並將這些知識帶到每一個將來的項目中。經過進行項目分解,你能夠從中梳理出有用的知識,這包括審查舊目標、舊計劃、技術選擇、團隊協做等。是否能夠應用於將來項目,經過項目回溯在過後進行思考,能夠幫助發現有用的知識,使你可以以不一樣的方式作事,並在下次更好。

不肯定性充斥在咱們每一個人工做的方方面面,記住過去給你帶來問題的全部不肯定因素,能夠防止相似的事情再次發生。從數據到分析再到項目目標,幾乎任何事情均可能在短期內發生變化。瞭解全部可能性不只是一項艱鉅的挑戰,並且幾乎是不可能的。良好的數據科學家和偉大的數據科學家之間的區別在於可以預見可能出現的問題並作好準備。

結論

數據科學仍然具備新領域的光環。它的大多數組成部分:統計學、軟件開發、基於證據的問題解決等等,這些多是屬於舊領域的知識,但數據科學彷佛是這些部分的新組合成新的東西。數據科學的核心並不關心特定的數據庫實現或編程語言,即便這些對於從業者來講是必不可少的,其核心應該是數據內容,給定項目的目標以及用於實現這些目標的數據分析方法之間的相互做用。

原文連接 本文爲雲棲社區原創內容,未經容許不得轉載。

相關文章
相關標籤/搜索