同窗A:22歲,男,大四準備實習,計算機專業,迷茫期
css
做爲一個很普通的即將邁入職場的他來講,看到周邊的同窗都找了技術開發的崗位,頓覺本身很迷茫,由於本身不是那麼喜歡鑽研寫代碼,而本身又沒太多的經驗。
那年他實習,選擇了一家國內一線梯隊的電商公司,HR問道想選擇什麼崗位,而他本人本身也比較困惑,說對數據感興趣。而剛好那年公司打算成立一個數據部門,就把同窗A分配到了市場部的數據組。
那時候主管是來自新浪背景的網站分析師。遇上了電商大潮,你們交流的比較多的就是網站分析的PV UV ROI 轉化率 訪問深度 老客戶佔比。作的比較多的是經過GA,百度統計,51la等網站監控平臺去監控數據。
而後這些常規的指標並不能知足實際的業務發展需求,由於市場部門要作人羣的短信營銷投放,預算比較有限,你們都但願在有限的預算內提升轉化的用戶。
同窗A開始研究起整個電商網站的用戶路徑起來,看了一本書叫《點擊流》。從介紹怎麼產生的網站日誌,網站的日誌是什麼格式,怎麼解析這些結構化的信息,怎麼存儲起來這些解析出來的數據,怎麼剔除那些沒用的日誌信息,怎麼提升天天數據解析存儲的性能,怎麼把這些數據臨時創建須要分析的數據表,怎麼經過sas python來訪問數據庫的數據,怎麼套sas模型來作那些用戶的關聯屬性模型,這些分析的結論是否合理,多高的支持率置信度也能夠應用到實際過程當中去,怎麼去監控這些投放的效果。種種的這些問題都讓同窗A感受很困惑。
這時候同窗A開始找數據倉庫的書開始看,知道什麼是OLAP OLTP,什麼是ETL,什麼是中間層,集市層,怎麼天天調度這些定時任務。經過幾個月的學習,以及請教數據倉庫的同窗,同窗A終於明白了天天的數據都在裏面,他們都是什麼產生,這爲同窗A在之後的數據底層表熟悉上打下了堅實的基礎。
-----------------2015.8.25更新-----------------------------------------------------------------------------------------------------
就這樣同窗A折騰了數據庫折騰了幾個月,期間由於同窗A有段時間在市場部門下面,因此市場部門的老大對同窗A說,「咱們但願可以創建起天天網站的運營監控體系,可以對天天的流量數據有清晰的認識,而對於網站的運營狀況也可以瞭然於掌,好比用戶都是從什麼渠道過來的?咱們但願可以在什麼渠道如關鍵詞仍是暴風媒介上進行進一步的推廣,好比用戶都常常來咱們網站點擊什麼頻道,是數碼產品仍是女裝鞋帽?」
這一堆問題忽然剛一個對整個網站或者整個電商體系都還不熟悉的同窗A有點hold不住,而同窗A也對本身有必定的信息,畢竟已經看了不少數據倉庫方面的知識,對整個公司的數據都存在哪裏都清楚明白。目前老大對他的要求已經開始須要學會可以應用到業務中去了。
同窗A先按照老大的意思,操起了excel。整理了一份本身以爲比較完整的excel表格,裏面包含了【流量分析報表】【運營分析報表】,前者更多的是圍繞網站的整個點擊狀況,包括網站的UV、PV、訪問量、訪問深度、平均訪問時長、客單價、訂單量、銷售額,這些宏觀的指標同窗A以爲應該能夠對一個網站的總體定位能夠清楚明白。而既然流量分析,就不止步於對網站的一個基本認識,同窗A回去思考了下,若是我做爲老闆會怎麼樣。「我固然關心我作一個網站須要花多少錢啊?」「我固然關心我花了多少錢賺了多少啊?」 同窗A想一想整個網站除了基本的架構搭建外,就是在市場推廣這塊花錢最多了,由於常常看到市場部的報表上寫着,這個月暴風影音投了30萬,360投了20萬,百度關鍵詞投了50萬。當時同窗A就在想若是這些錢都是個人就行了。=。= 而後想一想只歸想一想,這也讓同窗A以爲渠道推廣的確花了公司很多的money。
因而乎同窗A開始折騰起【流量分析報表】中的渠道推廣分析模塊,把公司推廣的不一樣渠道都整理下來,分類了一下,包括SEO/SEM、硬廣、媒介、聯盟、SNS、微博微信。凡是公司接入一個渠道,同窗A就整理一個渠道,並且經過天天的投入產品ROI等狀況,進行對比。包括哪些渠道適合在須要短平快的狀況下使用,哪些渠道適合慢慢作又不太會花太多成本,哪些渠道適合創建起公司比較好的口碑,哪些渠道是公司應該當即中止的。
老闆看到了同窗A作的這份報表,內心以爲很開心。證實同窗A是在這方面花了時間去思考的,其中在一些新媒體渠道,公司也是在作初步的嘗試,這也讓老闆發現了新媒體的力量。不須要花太多的財力物力,就能夠作一個事件營銷或者熱點營銷。老闆對A在渠道上的分析讚不絕口。
過了幾個月,公司發展的很快。從以前的一個小網站也發展到全國7個大區32個城市。一個幾十我的的公司也短短髮展到快1000人的公司,拆分了不少大區事業部。這時候老闆把同窗A叫進了辦公室,對同窗A說:目前公司發展很快,想了解下目前整個公司各個大區的狀況,包括每一個大區的幾個城市的用戶量、訪問量、銷售業績。同窗A爲了可以經過excel展現出來的效果好點,就去百度了下excel的地圖模板,恰好找到了一個不錯的模塊。能夠經過vlookup匹配出不一樣城市的數據狀況。而作了幾天後,同窗A也發現用戶基本上都集中在廣東、江浙、北京等地,銷售業績也都來源於這些地方。而男性購買的單價也更高些,女性購買的頻次更高些。在同窗A的腦海裏,彷彿有了網站用戶的一個畫像。
而公司發展的也超出同窗A的想象,從一個賣數碼產品更多的公司發展到一個全品類的公司。網站也多了不少頻道,包括秒殺、團購、特價、會員館。這時候老闆又叫來了同窗A,說打算在雙11搞了大促,主要想了解下什麼樣的人會在咱們網站選擇在節假日購買特價商品。
同窗A想,我丫的也歷來沒作過這東西,不知道怎麼作啊。也沒有任何思路,就去找數據部門的同事聊了聊,其中博士B姐講到,作用戶畫像其實在學術界是早有的概念,針對不一樣的用戶畫像作個性化營銷。
首先第一點,就是要明白咱們網站的用戶都是誰,都是什麼樣的,他們都住在哪裏,有什麼購物偏好;
第二點,他們的生活做息是什麼樣,是常常朝九晚五上下班,仍是不固定的購物時間;
第三點,咱們能夠經過什麼方式跟他們保持聯繫,是常常給他們發短信,仍是發郵件,仍是到地鐵裏去宣傳;
第四點,咱們以爲他們大概在何時須要什麼樣的商品;
第五點,咱們怎麼告訴他們。
同窗A在博士B姐的啓發下,從用戶的我的屬性上、用戶的行爲偏好上、用戶的訪問來源上、用戶的購買習慣上作了一星期的數據統計。得出了不少有趣的結論,在早高峯和下午4~5點訪問量爲主要高峯期,發生的訂單購買主要在早上和晚上8點,他們常常經過百度搜索關鍵詞的方式進來,而購買的65%也都是以前購買過的老用戶。同窗A把這些結論告訴了市場部門的同事,營銷策劃部門的同事們以爲同窗A的分析結論頗有啓發意義。以爲在雙11給這些用戶投放百度連接,在早上10點和下午3點、下午6點、晚上8點分別搞秒殺、半價活動。而就在當天雙11,整個公司都完成了一份整年都難以突破的業績成績。
同窗A在此次活動中感覺到了數據分析帶來的巨大商業價值,頗有成就感。
-----------------2015.8.26更新-----------------------------------------------------------------------------------------------------
時間過的很快,轉眼間同窗A在這家公司公司呆了一年半,遇到了瓶頸。眼看和本身一塊兒畢業的同窗,還有一些剛畢業的學弟學妹們都開始找工做,而他們就業應聘到的崗位薪水都比同窗A高。做爲一個已經工做一年多的同窗A來講,心裏面臨不少掙扎。
是選擇去和老闆提要求加薪?仍是選擇另謀出路?同窗A陷入了一段時間的困境。
而這年,電商也是傳統中的槍林彈雨,倒下的該倒下的,繼續燒錢的還在找下一個乾爹繼續玩資本的遊戲。當你們問到同窗A在哪裏工做,據說是國內一線互聯網公司,都投以羨慕的眼光。而各類滋味,只有同窗A本身清楚。
最後,同窗A眼看着和本身一塊兒進來的一些兄弟姐妹們都陸續離開了公司,再也坐不住了。選擇了和部門老大溝通,提出本身但願加薪的想法。說的也很簡單,本身工做一年多了,並且本身也負責作了很多case。相信做爲公司的同事們也都看到了同窗A的成績。老大聽了這個意見,決定給同窗A過幾天一個明確的答覆。過了一星期,部門老大約了下同窗A,決定給同窗A加薪1K。而同窗A聽到這個答覆,也沒有太多的詫異。自己不少一塊兒的同窗都選擇跳槽的緣由也是如此。
同窗A選擇了跳槽,在各個招聘網站開始投起了簡歷。約見面試的公司有作遊戲的、有作旅遊的、有作物流的、有作社交的、也有作電商的。同窗A鑑於深入瞭解電商公司苦逼加班的現狀,決定不想在電商公司再累死累活,而面試的狀況並不如同窗A想象的那麼如意,貌似不少公司提了一些很技術的問題,同窗A都沒有很好的答上。同窗A深入體會到剛工做一年的經驗想跳槽換家不錯的公司,遠比想象中的有難度。
再看到北京這樣的霧霾和房價,同窗A毅然決然在那個寒冷的冬天,背起行囊,選擇了南下。
此次,來到了上海這座大都市。
來到上海的第一感受,濃厚的金融環境,而再也不是北京那樣的屌絲都在創業的互聯網。而上海這塊作數據分析,又是互聯網的公司,屈指可數就那麼幾家出名的。所幸的是,此次同窗A在以前那些面試的經驗中,總結了很多教訓。
面試第一要學會總結,把本身過去的經驗和介紹都一五一十的說清楚,不要給面試官很混亂的感受。第二就是要誠實,忽然是在一個公司自己對數據分析的定位就不清楚,問了不少算法工程和後臺C++問題,讓同窗A以爲很茫然。其實若是你不懂就說不懂,自己的面試過程就是一個雙方選擇的過程。第三就是要作好準備,好比面試官在給你作提問的時候,確定是先看了你的簡歷。你本身對本身的過往經歷的一些細節都要可以回顧出來,好比你有沒有在一些細節問題上的思考,爲何用mysql來解決,不用oracle來解決,爲何建議營銷部門作拉新而不作激活,爲何當初選擇了離職。這些問題本身都能事先想一想。也便於本身在面試過程當中有個心理準備。
而正是此次不錯的技巧總結,讓同窗A斬獲了很多offer。包括知名旅遊網站、零售網站還有一些創業公司。最終同窗A以爲零售應該仍是互聯網公司的大頭,選擇了零售公司。
上班第一天,同窗A先在部門老大的帶領下,認識了以前作這塊工做的交接同窗C。同窗C本來是數據倉庫部門的同窗,由於一個項目的臨時調度,支持這塊的零售分析工做。部門老大讓同窗A先在數據倉庫部門學習2周時間,同窗A在數據倉庫的這兩週,看到你們都是在用oracle的數據庫,語法和以前寫的SQL基本都差很少。由於涉及到每次要導入導出的數據操做,數據倉庫還用到了PLSQL等腳本。而PLSQL其實和SQL都差很少,同窗A在3wschool上簡單看了下就上手了。
接下來的一段時間,部門老大看到同窗A基本上也快上手了。以爲沒什麼問題,就讓同窗A開始作BOSS John比較關心的一張營收報表。主要涉及到的是整個公司天天的用戶量、call center撥打量、轉化量、訂單客單價、送貨成功率、以及最後的營收毛利gross profit。同窗A這時候也是但願BOSS John可以看的比較清楚,就在主動搜尋一些圖表方面的技巧,看到《圖表之道》這本書講的還不錯,把一些excel的圖表技巧都講的很完全。
-----------------2015.9.1更新-----------------------------------------------------------------------------------------------------
給同窗A震驚到的是,歷來沒想到excel能夠作到商業週刊那樣的圖片效果,這給同窗A很大的觸動。決定將excel好好學習一番。從excel的基本內容介紹看起,包括單元格、圖標、函數、數據處理、數據分析、插件和VBA。而同窗A也結合本身的實際工做經驗總結一些經常使用的技巧和方法,好比怎麼匹配兩張表,怎麼將數組變成一列,好比怎麼快速搜索帶「,」的字段,好比怎麼將字符串的數字快速提取出來,好比怎麼將分列數組按照逗號分列。excel今後成爲了同窗A的分析利器。不少同事都戲稱同窗A爲「excel master」。
然而只有同窗A本身最清楚,本身永遠不能只停留在對excel很熟練這樣的程度,由於同窗A對將來充滿期待,但願可以有更大的發展。而環顧四周,發現周邊的同窗、同事都天天重複的朝九晚五的生活,天天都在聊着這個富家女怎麼樣,那個同事是否是結婚了之類的話題。
同窗A選擇了走出公司,週末開始積極參加各類各樣的沙龍組織活動,包括數據分析的,包括創業的,包括企業管理的。也就是這一次次的接觸各種各樣的活動,讓同窗A發覺原來其餘人也遇到本身同樣的困惑,也會有迷茫,也不知道本身公司的數據分析到底怎麼樣的定位好比合適,疑惑是公司的業務採起的措施是否正確,爲何公司的業務部門和技術部門老是死對頭。同窗A選擇本身好好思考,爲何你們都會有這樣的狀況。回憶起數據分析的發展史,在國內被接受也才這麼幾年,而你們談的更多的是數據分析、數據挖掘究竟是什麼,是對過去歷史數據的剖析、分析,仍是從中發現更多的問題和機會。同窗A不在糾結於此,他選擇了翻閱大量的國外的關於數據分析的案例,從那些實驗中找經驗。關注了不少數據分析、數據挖掘的網站、論壇、公衆號,常常看一些比較有趣的資訊,看看行業的大牛們都在聊些什麼。再結合好比手遊行業的流失模型是怎麼作,再衍生想一想怎麼應用到零售行業中去。
而這段時間也把本身的分析思路,作到PPT裏去。雖然老闆還只是讓同窗A完成簡單的數據統計就能夠了,而同窗A把本身嘗試的一些新想法都經過大量的數據驗證,作出了雛形。在excel裏面倒騰了不少基礎的數據,包括公司的用戶都是什麼年齡、什麼城市、有無子女、什麼收入、什麼工做性質,同窗A發現人羣和本身在電商公司的人羣性質很像,都是一線城市的年輕人羣。而再結合本身公司call center的銷售模式,同窗A彷佛發現了什麼。年輕人更多的購物方式都是網購,而電話銷售對於年輕人一羣來講,不是最能接受的方式。同窗A把本身發現的這個觀點總結在PPT發給了BOSS John。而後BOSS John並無給同窗A太多的評論。
過了兩週,同窗A繼續作起了客戶流失分析的PPT。裏面把天天的客戶流失率,每月的流失率,每一年的流失率作成了很大一張圖。只要找出對應的月份,就大概能夠估算出客戶的流失率。客戶流失集中在3個月內,3個月~1年是流失率下降的一個轉折點,而過了1年若是還沒流失,客戶基本上再流失的機率會很小。再結合公司的推廣拉新,分析了每一個客戶的成本是多少,是建議公司採起更多的廣告投放,仍是提升老客戶的回頭率,下降老客戶的流失率。這些都在同窗A的這張報告中寫的仔仔細細。確認了數據沒問題後,發給了BOSS John。
BOSS John週五喊了整個小組一塊兒開週會。在週會中回顧了下本週部門的工做以後,重點將同窗A作的分析報告打在投影儀上,你們都一塊兒看起了同窗A分析的結論。同窗A講起本身是怎麼考慮目前的公司經營情況,目前的數據都有什麼,從數據上看到了哪些業務存在的問題,天天其餘部門的同事的最大的痛點都在什麼地方,本身又是怎麼思考這些問題的,從哪些地方查的數據,可靠性如何,以及但願BOSS John給予哪些幫助。
你們都點點頭,以爲同窗A分析的這些問題都很實在。目前公司的重點應該是放在老客戶的維繫上,而這時候BOSS John也說了一句話,公司最近剛接到消息,之後的廣告投放的價格都漲價了,成本會愈來愈高。公司正打算對廣告投放部門削減開支,對相應的一些員工進行從新安排。而你們彷佛都明白了什麼。——裁人
過了一個月,同窗A陸續聽到市場部門的老大tannery離職了,短信營銷部門的主管LIU SIR跳槽了。而做爲同窗A的上級領導BOSS John接到董事長的命令,但願即刻到北京去交接以前市場部門的一些工做。就在BOSS John飛往北京的一週後,同窗A接到了BOSS John的電話,「目前公司的狀況你也應該多少了解了,但願你可以支撐起整個市場部門的數據部門工做。」同窗A聽的有點雲裏霧裏,本身平時不是那個說話最多的那個,也不是和BOSS John最親的那個。怎麼會讓本身接起整個數據部門的工做,雖然還在疑惑,但本身仍是對BOSS John說「我會繼續加油,好好幹的!」
後來HRG姐姐找到同窗A說道,「其實你們都看到你的想法,以爲你很聰明。平時也作了不少工做,加班加點認真負責。並且可以提一些本身的學習到的,頗有自我驅動力。」同窗A忽然以爲「功夫不負有心人」。
接下來的不少時候,同窗A也再也不是知足於本身作一些很漂亮專業的分析報告,而是更多的會和本身一塊兒合做的小夥伴分析師B、分析師C一塊兒聊如何改進目前的公司業務。而此刻只要BOSS問到同窗A目前的短信到達率是多少,客戶的回訪率是多少時,同窗A都能滾瓜爛熟。放佛本身心裏有一個計算器,已經不用還再去寫SQL查詢了。想起老古話「心中有數」,感受就是這樣!
過了2年多,由於公司的架構調整,整個行業的不景氣,同窗A選擇了離開。事實證實,同窗A也作對了。陸續的BOSS John也離開了公司。
而在同窗A準備選擇下一家公司時,卻接到了一個神祕的電話。
-----------------2015.9.7更新-----------------------------------------------------------------------------------------------------
手機顯示是個固定的座機號碼,同窗A想難道是哪一個公司又來邀請面試嗎?這段時間同窗A拿到了很多offer,漲薪也很多,甚至有開2倍價格的。而同窗A也在左右爲難,A公司離家近,B公司名氣不錯,C公司能夠給股權,D公司是創業公司而且相對比較自由,E公司離家比較遠不過項目不錯。
電話那頭傳來了一箇中年男人的聲音,這個自稱是ZJM的先生對A說道:「您好,請問是A同窗嗎?」「是,您好。」「哎,您好。很高興終於聯繫上你了。我是ZJM,是朋友john推薦我聯繫一下你的。John對我說了您不少的讚詞,咱們目前也是在作一家創業公司,但願您可以加入到咱們公司的團隊中來。」
「啊?」同窗A一時半會沒反應過來,原來是當時的Boss John推薦的一家朋友的公司。主要作的是進出口外貿的電商生意,區別於X寶/Z東之類的模式主要是大部分提供海外代購的業務,而由於有內部的合做渠道,因此能夠拿到更低的優惠價格。同窗A聽到這個介紹,心裏有了一絲觸動。
其實同窗A好久以前就已經明白本身想幹什麼。分析了本身的性格,本身屬於那種主動進取型的老虎性格,而本身也比較喜歡愛折騰,若是可以走上創業公司的道路,也是本身的一個不錯的選擇。本身也不但願在大公司的環境裏混吃混喝養老等死。而ZJM先生也是至關的有誠意,並不有聊太多的技術問題,問了下對電商這塊的領域的一些模式怎麼看待,家庭背景是什麼樣子,未來但願可以作哪些事情,對本身的愛好都有哪些。而A平時沒少想這些人生的問題,對於本身將來的道路,多少有些明白。ZJM先生在電話那頭說道:「那今天先聊到這裏,過兩天會安排下另外的同事再電話溝通下。」
過了一個星期,電話那頭又響起了。此次是個溫柔的女生的聲音,她叫ZY。是這家公司負責HR方面的同事。ZY說道:「上週咱們Boss ZJM已經和你溝經過了咱們的具體狀況了。但願可以邀請到你加入到咱們公司。通過一週的商量討論,能給到你年薪30W,外加出差和行政類的補貼。另外經過試用期能夠有相應的股權。」
說實話,對於A這樣一個還未滿25歲的年輕人來講,這樣的待遇真的讓A有些心動。A第一次聽到有這麼競爭力的待遇,而本身心裏也有一絲的激動。對因而否是創業公司,是否離家近遠,這時候都不是問題了。而本身也是第一時間把這個喜訊告訴了爸媽,爸媽是很普通的事業單位的職工,聽到兒子這個消息,都感到很高興。
一個星期後,A沒有猶豫,來到了這家創業公司。
第一眼,給A留下印象的就是。創業公司再也不像A呆過的以前大公司的形象。這家公司只是很樸實的一層辦公區域。沒有很是華麗的前臺,也沒有很大的辦公場地,有的只是十幾個辦公桌和三三兩兩的一些同事。而從你們的臉上也看能的出一份輕鬆和夢想啓航。ZY同窗接待了A,告訴A今天ZJM先生不在公司,去出差了。ZY先領着A熟悉了一下辦公環境,認識了一下週邊的同事。
A觀察了下,大概總共有15我的的團隊。有10個都是作技術的,包括java開發,前端開發,產品經理。和5個作商務拓展的美女同事。上午就這麼輕鬆的在一個團隊熟悉的環境下結束,你們中午一塊兒吃了午飯,你們都是聊的一些很輕鬆的話題,包括最近什麼APP又火了,他們的模式是什麼樣子,XX公司又融資辣。A可以感覺到你們都是很容易相處的同事。
下午,ZJM回到了公司,安排了一個全體的迎新會議。ZJM也但願同窗A可以承擔起建設整個公司數據部門的角色。1.可以創建起整個公司的數據蒐集框架,包括網站的數據,客戶的數據,交易的數據等系統;2.可以快速支持公司的數據業務,包括商務的數據分析公司和大老闆的數據需求;3.可以搭建起公司的數據團隊,負責招聘人才和培訓整個團隊;4.對公司的業務負責,可以承擔起數據推進業務的重任。
A聽完以後,倒吸了一口冷氣。說實話,感受本身一會兒擔子很重。本身從前都是本身單打獨鬥比較多,此次要承擔起建設一個數據部門的重任。多少對本身的能力產生了一絲懷疑。A在會議上,說了本身的感想和打算,計劃一週內把整個團隊的未來的人員配置(20人的數據團隊,5個數據倉庫,3個ETL工程師,5個數據分析師,3個建模工程師,2個架構師和2個數據產品經理),以及怎麼創建起公司的數據中心,包括公司的客戶管理系統+交易系統+行爲數據中心+風險控制中心+客戶營銷管理中心+財務管理中心+數據分析中心等。ZJM聽完以後,點了點頭。
一星期後,A開始在公司演講本身作的PPT,包括須要技術部門有哪些支持,包括數據中心但願怎麼搭建,包括須要什麼軟件來支撐,包括數據中心之後怎麼發揮數據的光和熱。技術部門老大lu問了幾個技術方面的問題,包括數據怎麼蒐集,能夠安裝什麼監測數據的軟件,之間的優缺點是什麼。而產品經理基本都是點頭支持,表示會全力支持A的工做。而本次商務都沒參加這樣的會議。
接下來的一週裏,技術部門都在忙着測試網站代碼,準備近期的上線內測。A邀請了技術部門探討過幾回會議,可以在開發相應公司的時候,提早加入對應的埋點,方便數據的蒐集。同時每塊的埋點規範是什麼,也整理了相應的PRD和需求文檔發給了各位技術的開發人員。後面就是不停的推技術部門的同事,但願他們可以儘快開發完。
時間很快,短短3星期過去了。A本身回顧了這段時間的變化,感受在創業公司區別於以前就任的一些大公司,1.要勇於提出本身的想法建議,你們之間的想法都比較純粹;2.工做的氣氛比較自由,有下午5點就下班的,也有上午10點半纔來上班的;3.不少事情都要本身動手解決,沒有能夠推卸給誰的時候;4.要有從0到1的心理準備,要不停的去和外界交流學習。
網站如期上線,晚上你們一塊兒去吃了頓大餐慶祝了一下。接着又去外灘18號酒吧,跳了一夜。A以爲這纔是本身想要的團隊的氛圍,你們都像是一家人。
也許只有本身明白本身要什麼,纔不會迷茫,也不會困惑本身到底適合創業公司仍是大公司。不少時候是機遇,也是巧合。
-----------------2015.9.9更新-----------------------------------------------------------------------------------------------------
三個月過去了,A順利的經過了試用期。ZJM先生這天喊A進了辦公室,對A講:「咱們如今公司的定位也是但願可以作區別於X寶這樣的海外購業務。下週韓國和日本的商務會出國去採購,到時候網站上線了就會有不少訂單。之後也會開展不少國家的業務。目前如今這片的市場還很空缺,咱們也是但願可以遇上時代的浪潮。」html
在A看來,ZJM像是本身的一個老哥哥,對本身講述着本身將來的規劃和想法。這讓A有些感動,以前幾家公司的職場經歷,你們都是很好的朋友和同事,但不多會聊的這麼細,更況且是本身的老闆。而ZJM也更多的時候沒有以一種上下級的態勢來處理之間的同事關係。前端
A後來據說ZJM原來是從事互聯網零售行業的一位老兵,連續創業了不少次了。23歲的時候就已經當時作了一款手機遊戲賣掉2000萬。27歲的時候已經在一家知名公司擔任市場總監,29歲的時候選擇了再次創業作外貿。這些年經歷了由傳統的零售到互聯網化的時代變革,原來作外貿進出口,訂單量特別多,不多會考慮去宣傳什麼,本身對接的是江浙滬地區的企業。直接拿到訂單就開始聯繫合做的企業進行生產加工。那些年賺了很多。而最近幾年行情大變,再也不是那種不愁吃喝的年代。工廠工人工資須要漲,招聘的人愈來愈難找,進出口的產品也沒有了之前的價格優點,大多狀況靠的是原來的一些客戶關係維繫。A發現本身的老闆原來這麼厲害,內心不少崇拜。決定多向ZJM請教業務上的問題。java
想一想本身當時22歲時候想過3年作上數據經理,過5年作上數據科學家的理想是多麼的扯淡不堪。仍是多踏實作點實事。python
晚上,你們部門幾我的都聚餐吃了頓飯。也就在這時候,來了一位新朋友,來自北京的tina,據瞭解是ZJM請過來作項目經理,而這位空降的新同事在接下來的日子也暫時接管了數據部門的一些工做。mysql
ZJM介紹tina有着豐富的項目管理經驗,在香港/美國都有不少年的工做經歷。而tina第一眼給人的印象也很是的好相處。可A沒有想到,就在tina入職後的3個月裏,讓A有了很多的煩惱。web
次日tina約了下A,想多瞭解下目前數據方面都有哪些工做。雖然tina不是技術背景出生,A仍是儘可能用天然化的語言講述了目前數據方面都大概有哪些工做內容和計劃。tina聽完以後也說道,目前公司作的這塊海外業務和數據有很大的密切關係,後面應該會有很多的工做須要作。會後,tina讓A整理了一份會議紀要。面試
接下來,又約了技術部門/產品部門的幾位同窗一塊兒討論,打算本身內部開發一套客戶關係管理系統的計劃。你們都七嘴八舌地討論開了,有人說要能給客戶按期的發送短信,有人說咱們要能接入用戶的生日年齡的數據,也有人說但願可以打通營銷平臺,還有技術開發說開發會須要很長的時間週期。算法
你們通過二週的時間討論,須要敲定了具體的開發時間節點。
接下來的幾周開發時間裏,tina都把A叫上去參加大大小小的技術討論會議,一扯就是半天,剛開始還好。然後面隨着其餘業務部門還有老闆的需求愈來愈多,而本身又要和技術不停的碰CRM的需求,本身算是忙的焦頭爛額。本身想本身是作數據方面的,怎麼也參與起了整個項目的開發討論。又看看tina天天的工做就是寫寫郵件,好像大小的活兒都是本身乾的,心裏很不平衡。sql
而A也把本身這樣的狀況告訴了本身的師兄Ben,Ben畢竟本身工做和創業多年,告訴A在職場這個狀況都是很正常的。你要學會主動,學會承擔,學會兌現承諾,更要學會拒絕。否則你就會被大大小小不想幹的事情給搞暈。學會見縫插針,什麼是重要的,什麼是緊急的,本身列個天天的計劃表。
A點點頭,以爲頗有道理。後面天天的工做本身到公司的第一件事情,就是先想一想本身天天大概須要作哪些事情,而哪些又是一些臨時的突發需求。對一些不必參加的大小會議,本身選擇了拒絕。忽然一會兒,感受本身的時間能夠作主。
而對於tina來講,卻是沒有這樣想。tina找到了ZJM,聊了下對A的印象,感受A不太好管理。ZJM會然一笑。而這話正好被通過門口的A聽見。A心想,這不是跑到老闆那邊打本身的小報告嗎。內心想一想很不爽!這讓A頓覺不是當時那個有愛的你們庭的感受。本身想說些什麼,但又以爲是否有必要去說些什麼。
在那年過春節的時候,tina早早的休假了。A在大年三十想早點提早走,打電話想和tina溝通下,結果電話提示該用戶已關機。A就寫了份郵件給tina,說明了下狀況。回家過年了。
過完年,你們都陸續地來上班了。tina到達公司,約了A和部門的行政助理,和人事的一塊兒開週會。重點講了下有些人沒有提早請假,就回家的事情。A知道是在說本身,內心沒有什麼想說的。
就在次日,A給ZJM提上了辭職信。寫的也比較情緒化,感受本身不能勝任工做,並且違反了公司沒有請假的規定。
ZJM晚上約了A到辦公室,聊了下大概的狀況,ZJM說這些狀況都無需放在心上,本身知道實際的狀況。讓A繼續好好工做,辭職信就先放下。A想還好老闆理解本身的狀況,暫時內心的委屈有些緩解。
接下來的工做歲月裏,A把公司當成了本身的家,天天都加班到很晚。本身在此次經歷中深入體會到本身隨時均可能滾蛋,爲了本身在職場不能被別人戰勝,甚至是被本身戰勝,本身開始作起各類準備。可以在本身的簡歷上添上不少亮點,天天開始整理回顧本身的天天的工做都有哪些,在實際的業務中起到什麼做用,最後取得了哪些了哪些業績。在獵聘網上,也放了一份簡歷。沒多久就接到很多獵頭的電話,上海有很多不錯的公司有沒有興趣,能夠去面試看看。A都拒絕了,感受本身在目前的公司仍是待的比較舒服的,天下烏鴉通常黑,說不定去了一家還不如如今的公司。
-----------------2015.9.11更新-----------------------------------------------------------------------------------------------------
A目前很清楚地明白本身的之後定位是什麼。明白本身想要的是什麼。經歷過這麼多得職場,遇到過形形色色的主管、老闆、同事、朋友、合做夥伴以後,也對整個職場的人際處事有了更深的認識。
有人說,職場就應該PMPMP(拼命拍馬屁)。而A追求的偏偏不是這樣的成就感,他須要那個心裏深度的本身承認本身。對本身負責,想起了那個《三傻大鬧寶萊塢》:追求卓越,成功就會出其不意找上門來。
這一天是7月13號,A報名參加了一個大數據的線下沙龍聚會。主題介紹了分享互聯網下的大數據分析應用。今天上海很熱,外面的度數有38℃。可能大部分同窗都想一想仍是在家吹吹空調、睡睡覺算了。A仍是頂着大太陽堅持來了。過來簽了下到,看到現場仍是有很多相仿年紀的人過來。感嘆了句,還好過來了。選擇了個後排的位置坐下,等待2點的正式分享會。
而就在這個時候,手機QQ響起來。以前在網上一直請教A關於數據分析問題的Ariel發來消息。『你也在那個大數據分享會現場?』『是的啊!』『我中午剛過來,你坐在哪裏呀?』『我在第八排的靠走道的位置。』
忽然前面有個妹子站起身來,從A走了過來。A的第一反應,『哇塞!好漂亮啊!』
Ariel客氣地笑了笑,『你旁邊沒人吧,我能夠坐在這邊麼?』『能夠能夠。』
2點開始了,主持人上了臺,首先來了場關於大數據的開場白。講述了大數據如今已經由互聯網天天海量的信息產生,區別於過往的傳統BI報表分析。而今天所要分享的課題就是,①互聯網領域下的大數據架構,主講人是來自某國內知名上市公司的架構師;②大數據背景下的數據可視化應用,主講人是tableau的技術總監;③如何應用大數據解決實際業務問題,主講人也是來自某一線品牌的電商公司的市場總監。
第一個分享主題,嘉賓主要介紹了目前某知名上市公司如何經過成千上萬臺集羣解決數據併發量的問題,電商體系的框架架構有哪些,金融體系支付環節的架構有哪些,以及如何經過Hadoop和spark、hana作到數據的offline、online的數據迭代。
第二個主題分享的更可能是tableau的操做,由於現場不多有人帶電腦,因此沒辦法實際體驗操做一遍。不過A感受到tableau在可視化方面仍是作得很厲害,一些展現的圖形仍是很值得借鑑。
最後的嘉賓重點介紹在作廣告資源位上,如何應用上數據分析和機器學習。在不一樣的banner、tips、index、search、product detail、shopping cart上作實時的廣告投放。結合用戶現有的我的屬性特徵,和用戶的實時behavior log,計算item值。
A聽得雲裏霧裏,以前都沒接觸過這塊。不過仍是感受不錯,學習了不少。最後結束環節,抽獎,A幸運的抽到了《集體智慧編程》。那是一本介紹用python怎麼開發推薦算法的書。
回到公司,A沒有太多的心思在數據分析上。腦子裏仍是回憶着Ariel的身影。想起仍是勇敢的打電話約了Ariel週末有沒有時間吃飯,惋惜Ariel電話回道週末要加班。A有點灰心。有趣的是,A在刷微博看到了一篇文章《怎麼用數據追女神?》
圖(一)用數據追女神
A以爲這也真是太逗了,竟然數據分析的應用能夠到人與人之間的約會上。A分析了本身和Ariel也只是第一次見過面,的確離6次仍是有些差異。本身對Ariel也不是特別的瞭解,也不知道她的喜愛,在哪裏工做,平時都幹什麼。再想一想本身的簡單粗暴地魯莽行爲,感受真是太不靠譜了。
工做日的下班時間,A開始經過微博、微信關心起Ariel,聊聊最近都在忙什麼,平時都去哪裏玩。很快,Ariel和A聊的很來,你們都對歐美比較輕快的音樂感興趣,喜歡好萊塢的科幻大片,瞭解到Ariel在乙方的數據公司工做,因此平時的工做時間段都比較忙,天天要應付甲方的各類數據需求。
過了兩週,A約了Ariel一塊兒去看了剛上映的《環太平洋》,用淘寶電影購買了當時的電影票,不過那時候沒有像如今的每週六半價這麼給力的優惠政策,也沒什麼貓眼等給力的打折。
ZJM看到最近A的心思都沒有放在工做上,看到有些報表上的數據都填錯了。約了整個部門的同事,晚上到一家日本料理店,聊聊最近的一些工做狀況。晚上,你們都來到了這家日料店,整個店鋪的環境就是按照日本的當地風俗裝扮,看起來頗有檔次感。
吃飯中,ZJM問了下A最近是否是有沒有煩惱。A笑了笑,最近在追一個女孩。分享了下本身還看到一篇頗有趣的關於大數據如何追女神的文章,ZJM聽到哈哈大笑。追女孩有數據是不錯,更多的是人與人之間的相處,要用心,而不是光靠數據。
A聽到以爲頗有道理,實際狀況比簡單地數據表現複雜不少。這時候Tina說道,『喲,沒看出A仍是單身啊?看着應該像女友很多的樣子吧。』A有些不想解釋,畢竟這不是本身的做風。Tina又繼續說道,『通常25歲尚未女友,要麼就是比較花心,要麼就是被剩下的屌絲。』A聽到有點頭皮發麻,頓覺tina怎麼這麼攻擊別人。這時候ZJM笑道,在上海男生結婚平均年齡在30歲呢。Tina恭維道,『仍是Z總,對數據很熟悉敏感啊,這樣的行業數據都這麼熟悉。』,站起身,給ZJM倒了杯清酒。
-----------------2015.9.14更新-----------------------------------------------------------------------------------------------------
然而這一年,外貿也過的不舒心。寒冬來的很快,雖然你們對外來進口的品牌頗有好感,也很容易接受,可是對於一家想發展爲幾個億業績目標的公司來講,天天幾十單仍是任重道遠。而面對歐債危機的蔓延,整個全球的經濟都發展的不是很好。ZJM陷入了思考。公司剛成立1年左右,本身對經過國外進出口企業合做下降海淘成本也很看好。
ZJM以爲應該行動起來,A也和ZJM一塊兒動身去了香港。公司安排在香港先作一些線下的商超、地鐵等人口繁華的地段進行品牌的推廣。ZJM隨便採訪了幾個路過的行人,問了下你們在選擇海淘的環節都通常會關心哪些問題。有的說主要是看重進口產品的質量,有的說是看重了品牌溢出的價值,有的說欣賞海外海淘的這種方式,也有的喜歡更低的優惠價格。
這和當時本身思考,一味經過價格優惠優點來吸引顧客的想法仍是有些出入。也是在數據端爲何訂單沒有太明顯提高的緣由。A也以爲,這些實際的狀況的確是很難坐在辦公室裏想清楚的。真正能作好數據的,理解商業的,是走出來!
這時候A也有了一些靈感,以爲回公司好好分析下,目前整個網站顧客的新老顧客問題。作了一週,看到了不少驚奇的地方:①在國內下單的第一個客戶是在上海的一個美國人;②下單量排名靠前的依次爲母嬰、化妝品、鞋包,並且以女性爲主;③下單的客單價平均都比本身預期的要高,顧客有囤貨的習慣;④老客戶的回訪率很高,並且是在特定的品牌上。
A以爲,想要作好外貿海淘這塊,真正須要服務好的,是那些有海淘習慣的老顧客。
ZJM聽到這個分析,回想起本身在香港的查勘經歷,實際狀況也驗證了這幾點。而本身沒想到的是,有在國內的老外也有海淘的習慣。這是本身真沒有料到的狀況。ZJM火燒眉毛叫來的市場部門的BD和策劃,但願可以作一個全年的海淘推廣方案。重點是在母嬰、化妝品等有知名度品牌的線下商場。
A也理了一些方案,包括:
1.按期發佈新產品的信息,在各B2B、B2C網站更新本身品牌的產品信息,在產品位置排序權重中不要拖後腿;
2.開發一套完整的CRM客戶管理系統,包括對老客戶的生日提醒,新品發佈的提醒,半價打折促銷等消息的提醒,客戶對平臺的反饋聲音,同行業的微博討論的熱點監控;
3.按期總結和分析每日、周、月、季度的業績狀況,每一個環節的轉化是否正常;
4.對老客戶聲音的重視,安排專人的私人客服解決老客戶反饋的問題和建議。
功夫不負有心人,通過2個月的努力,公司從每月1500單直接翻番到3000單,從具體的提高數據來看,3000單裏有70%來源於老客戶的。這個數據也讓A堅決了信心,要作好這個CRM系統。
A在網上找了幾家這樣的外包公司,聊了聊大概的須要,想了解下具體若是外包給第三方公司的話大概須要多少成本。而不少外包團隊都反饋消息稱,沒辦法給出一個肯定的報價,須要A整理出具體的需求文檔,最好有PRD能夠提供出來。而A正好想起本身在大學時期,業餘的時間還折騰過axure。找到了公司的部門產品經理bob,請教了你們能夠怎樣方便快捷的畫出產品的PRD。
晚上,爲了感謝下bob,約了bob去最近的一家牛肉火鍋店吃晚飯。正好也是想多瞭解瞭解產品經理這塊具體都作些什麼事情。提及這家牛肉火鍋店也很特別,店鋪的老闆不是一我的,而是不少人一塊兒籌錢衆籌的一家火鍋店。而這時候衆籌也是一個很新的概念,你們聽到的更可能是關於衆包的概念,對於衆籌,還真是第一次據說。
正好其中有個老闆今天在,就給人介紹了下。衆籌最初是艱難奮鬥的藝術家們爲創做籌措資金的一個手段,現已演變成初創企業和我的爲本身的項目爭取資金的一個渠道。衆籌網站使任何有創意的人都可以向幾乎徹底陌生的人籌集資金,消除了從傳統投資者和機構融資的許多障礙。衆籌的興起源於美國網站kickstarter,該網站經過搭建網絡平臺面對公衆籌資,讓有創造力的人可能得到他們所須要的資金,以便使他們的夢想有可能實現。這種模式的興起打破了傳統的融資模式,每一位普通人均可以經過該種衆籌模式得到從事某項創做或活動的資金,使得融資的來源者再也不侷限於風投等機構,而能夠來源於大衆。在歐美逐漸成熟並推廣至亞洲、中南美洲、非洲等開發中地區。國內衆籌與國外衆籌最大的差異在支持者的保護措施上,國外項目成功了,立刻會給項目發錢去執行。國內爲了保護支持者,把它分紅了兩個階段,會先付50%的資金去啓動項目,項目完成後,肯定支持者都已經收到回報,纔會把剩下的錢交給發起人。截至2014年7月,國內有分屬於股權衆籌、獎勵型衆籌、捐贈性衆籌等不一樣形式的平臺數十家不等。
A以前對衆籌這塊還了解的不夠深刻,只是據說有非法集資的風險。當時也沒聽懂,就沒放在心上。
這個時候A問起了bob,
「bob,你結婚了嗎?」
「還沒呢,不過男友已經有了。打算年末結婚吧。」bob說道。
」買房了嗎?上海這邊房價不便宜啊。「
」是買啦,我和我男人是典型的房奴。他買在松江,我買在浦東這。還好咱們沒有結婚,否則我今年買的話,就算第二套房了,要多叫5,6萬的稅。「
A笑起來,」土豪哈!「
兩我的就這樣聊了一夜,彼此都成了很好的朋友。而A對產品這塊的理解,真的要多感謝感謝Bob對本身的幫助。
次日,A把產品的PRD畫好後,發給了外包公司。對方報了個差很少的價格,計劃開發週期是3個月,A把這個消息發給了ZJM。ZJM點點頭,以爲A很不錯啊,可以本身幹起了產品這塊的工做了。看到外包公司給出的價格也比較合理,讓A找個時間,去外包公司當面聊下,能夠的話籤個合同。
-----------------2015.9.18更新-----------------------------------------------------------------------------------------------------
週末A和外包公司聯繫上,上午去拜訪了。這家外包公司坐落在徐彙區的老田林,簡單的環境,週末有三四我的在公司上班,看起來你們都在研究着本身的東西。A走進了丁總(外包公司leader)的辦公室,聊了下想作成什麼樣子。
A說道:『咱們但願可以作一個CRM系統可以維護起咱們目前的客戶資料,主要的功能點有:營銷過程當中得客戶資料支持,產品銷售的業績跟蹤,以及客戶的服務。
重點場景包括:1.咱們可以知道咱們的客戶是誰?是什麼樣的人?有什麼特徵?可以幫助市場人員分析現有的目標客戶羣體,如主要客戶羣體集中在哪一個行業、哪一個職業、哪一個年齡層次、哪一個地域等等,從而幫助市場人員進行精確的市場投放。
2.可以對接各個營銷方式,如SMS、iagent、EDM、客戶端push消息。
3.產品銷售環節可以包括潛在客戶、客戶、聯繫人、業務機會、訂單、回款單、報表統計圖等模塊。業務員經過記錄溝通內容、創建日程安排、查詢預定提醒、快速瀏覽客戶數據有效縮短了工做時間,而大額業務提醒、銷售漏斗分析、業績指標統計、業務階段劃分等功能又能夠有效幫助管理人員提升整個公司的成單率、縮短銷售週期,從而實現最大效益的業務增加。
4.客戶服務模塊可以有客戶反饋、解決方案、滿意度調查等功能,包括輿情的監控、客戶經過短信、官網、微博的反饋意見,客戶的滿意度調查問卷結果,客戶的投訴等。』
丁總點點頭,給A展現了以前作過的幾個成功的項目,哪些能夠直接造搬,哪些須要修改的地方。
A問了大概須要的具體開發時間週期,大概每一個模塊的開發時間節點,每一個模塊的報價以及公司對接的哪一個同事。
中午兩人去了樓下的一家東北菜吃了下飯,A以爲好久沒有吃到那個在北京時候的味道了,菜量很足讓A有些懷念。丁總說,本身也曾經是在某家公司的總監,和幾個兄弟一塊兒作技術方面的工做。後來公司調整,裁了很多人員。丁總就和本身的幾個開發同事一塊兒離開了公司,註冊了一家開發的新公司。不少時間都是靠本身的以前客戶幫忙介紹的訂單,目前也接了華爲一些比較大的項目,爭取今年可以把公司的知名度作出。
A下午回去後,和ZJM具體說了下大概的狀況。ZJM審批了下這個項目,決定開始作。
過了兩天,ZJM安排A去面試一個來的應聘者。他叫Z,是剛畢業的同窗,從簡歷上看得出Z在大學幹了很多兼職的事情。可是都作得比較雜,來面試聊過以後發覺Z對本身的將來也是比較迷茫。對基本的數據庫第一範式、第二範式這些仍是有些瞭解,不過其餘的關於數據分析的就知道的很少了。A面過以後,讓Z回家等通知。過後ZJM問A怎麼樣,A搖搖頭。
這天,Ariel打來電話,問A晚上有沒有時間,想請教A一些關於報告的問題。想了解下A是怎麼快速地寫分析報告的。
A晚上如期而至,挑了家比較輕鬆愜意的餐廳。A介紹到當年本身作分析報告的經歷,那時候作分析報告其實也是很是的菜鳥,後來看到一個蠻厲害的網站分析愛好者寫分析報告,傳說是每星期會寫3~4份很是專業的報告,當時就偷偷的去看他是怎麼寫的。
天天大神總會在艾瑞諮詢、易觀國際、百度數據中心、情報中國網搜刮一些行業數據分析報告,研究他們的分析報告框架和報告分析思路。瞭解每一個報告的一些經常使用的圖表、文字、分析結論的方法。把這些經常使用的圖片元素和excel處理保存下來。而在寫一個分析報告以前都會找業務方瞭解具體的業務都是什麼樣的現狀,平時工做的內容都有哪些,難點是什麼,但願獲得技術和數據方面的什麼支持。而這些困難和挑戰當中,哪些是能夠解決的,哪些是目前不能解決而將來有但願解決的,哪些須要獲得什麼樣的幫助。
A把大神經常使用的SWOT分析、波士頓分析、4P/5W1H等經常使用的市場營銷方法整理了下,記憶中也找到一本關於《100個經營管理工具箱》的電子書,裏面講解了不少關於經管上的分析方法論。
而對於分析報告中經常使用的先分析目前的現狀,到發現目前的問題,到提出解決目前問題的方法,以及從目前業務中發現機會。這樣的分析路線在之後的A寫得分析報告中常常應用到。
A告訴Ariel,寫一個報告最重要的就是找到分析的框架,就像建房子同樣。有個框架以後,就分析整個業務的來龍去脈、知其然、知其因此然並作到望聞問切。Ariel點點頭,但仍是有些不太可以理解。
-----------------2015.9.21更新-----------------------------------------------------------------------------------------------------
A細心的講解了下,首先,要有一個好的框架,跟蓋房子同樣,好的分析確定是有基礎有層次,有基礎堅實,而且層次明瞭才能讓閱讀者一目瞭然,架構清晰、主次分明才能讓別人容易讀懂,這樣才讓人有讀下去的慾望;
第二,每一個分析都有結論,並且結論必定要明確,若是沒有明確的結論那分析就不叫分析了,也失去了他自己的意義,由於你原本就是要去尋找或者印證一個結論纔會去作分析的,因此千萬不要忘本舍果;
第三,分析結論不要太多要精,若是能夠的話一個分析一個最重要的結論就行了,不少時候分析就是發現問題,若是一個一個分析能發現一個重大問題,就達到目的了,不要事事求多,寧要仙桃一口,不要爛杏一筐,精簡的結論也容易讓閱者接受,減小重要閱者(一般是事務繁多的領導,沒有太多時間看那麼多)的閱讀心理門 檻,若是別人看到問題太多,結論太繁,不讀下去,一百個結論也等於0;
第4、分析結論必定要基於緊密嚴禁的數據分析推導過程,不要有猜想性的結論,太主觀的東西會沒有說服力,若是一個結論連你本身都沒有確定的把握就不要拿出來誤導別人了;
第五,好的分析要有很強的可讀性,這裏是指易讀度,每一個人都有本身的閱讀習慣和思惟方式,寫東西你總會按照本身的思惟邏輯來寫,你本身以爲很明白,那是由於整個分析過程是你作的,別人不必定如此瞭解,要知道閱者每每只會花10分鐘之內的時間來閱讀,因此要考慮你的分析閱讀者是誰?他們最關心什麼?你必須站在讀者的角度去寫分析郵件;
第六,數據分析報告儘可能圖表化,這實際上是第四點的補充,用圖表代替大量堆砌的數字會有助於人們更形象更直觀地看清楚問題和結論,固然,圖表也不要太多,過多的圖表同樣會讓人無所適從;
第7、好的分析報告必定要有邏輯性,一般要遵守:一、發現問題 二、總結問題緣由 三、解決問題,這樣一個流程,邏輯性強的分析報告也容易讓人接受;
第8、好的分析必定是出自於瞭解產品的基礎上的,作數據分析的產品經理自己必定要很是瞭解你所分析的產品的,若是你連分析的對象基本特性都不瞭解,分析出來的結論確定是空中樓閣了,無根之木如何叫人信服?!
第9、好的分析必定要基於可靠的數據源,其實不少時候收集數據會佔據更多的時間,包括規劃定義數據、協調數據上報、讓開發人員 提取正確的數據或者創建良好的數據體系平臺,最後纔在收集的正確數據基礎上作分析,既然一切都是爲了找到正確的結論,那麼就要保證收集到的數據的正確性,不然一切都將變成爲了誤導別人的努力;
第10、好的分析報告必定要有解決方案和建議方案,你既然很努力地去了解了產品並在瞭解的基礎上作了深刻的分析,那麼這個過程就決定了你可能比別人都更清楚第發現了問題及問題產生的緣由,那麼在這個基礎之上基於你的知識和了解,作出的建議和結論想必也會更有意義,並且你的老闆也確定不但願你只是個會發現問題 的人,請你的那份工資更多的是爲了讓你解決問題的;
11、不要懼怕或迴避「不良結論」,分析就是爲了發現問題,併爲解決問題提供決策依據的,發現產品問題也是你的價值所在,相信你的老闆請你來,不是光讓你來唱讚歌的,他要的也不是一個粉飾太平的工具,發現產品問題,在產品缺陷和問題形成重大失誤前解決它就是你的分析的價值所在了;
12、不要創造太多難懂的名詞,若是你的老闆在看你的分析花10分鐘要叫你三次過去來解釋名詞,那麼你寫出來的價值又在哪裏呢,還不如你直接過去說算了,固然若是無可避免地要寫一些名詞,最好要有讓人易懂的「名詞解釋」;
十3、最後,要感謝那些爲你的這份分析報告付出努力作出貢獻的人,包括那些爲你上報或提取數據的人,那些爲產品做出支 持和幫助的人(若是分析的是你本身負責的產品),確定和尊重夥伴們的工做纔會贏得更多的支持和幫助,並且我想你也不是隻作一錘子買賣,懂得感謝和分享成果的人才能成爲一個有素養和受人尊敬的產品經理。
Ariel將這個收藏在《數據分析報告怎麼寫》當中。
-----------------2015.9.23更新-----------------------------------------------------------------------------------------------------
過了兩天bob跑過來,問A週末有沒有時間,有個朋友組織數據分析活動聚會。A一口答應沒問題。正想週末無聊不知道幹嗎呢。平時發如今上海的數據分析聚會活動也不多,此次聽說是bob的一個朋友組織的。對於可以在上海有這樣的聚會A很興奮。
總算到了週六,A早上寫完週報趕忙看看了今天分析聚會的主題《數據分析在企業中的應用》。中午吃了頓飯,和bob約了在人民廣場地鐵站碰面,此次聚會地址定在上海老站,那個地方在徐家彙附近,算是一個比較嫺靜的好聚處。Bob讓A認識了下在這個行業作了十多年的翟哥,看到翟哥的第一眼,A以爲翟哥應該是一個比較老實的技術男,待人接物穩重,說話慢條斯理,長相敦厚。
後來瞭解到翟哥是作了不少行業,汽車、電商、零售行業,SAS玩得很溜,也作了不少網站和論壇。發表過很多關於數據分析工具使用的文章,也整理了很多數據分析方面的資料。
此次聚會還認識了base在杭州創業的朱哥,朱哥給人的感受就是在外面創業的,像一個初創公司的CEO,拎着公文包,時刻準備着跟人談生意的感受。還有作外貿的薩姐,作美股操盤手的慧姐,以及和本身差很少大的D姐。
今天邀請的是來自HD公司的高級數據分析師軍軍同窗來作的分享,主要圍繞數據分析在其零售公司中的一些實際場景的應用。2點你們都坐好,準備起分享的主題。軍軍同窗主要介紹了HD公司的營銷系統框架,產品→數據→營銷→用戶。產品主要根據季節、功能、屬性、地區等維度作區分,結合目前已有的CRM/ERP/DW等系統的數據,經過不一樣的營銷方式和不一樣種類的用戶作個性化。其中數據方面的應用軍軍作了下重點分享,圍繞用戶是誰,用戶幹什麼,用戶有什麼需求,咱們能夠給用戶提供什麼作了下分享,但A看得出來不少公司都是這麼來作得,沒有聽出太亮點的地方。而在HD作營銷的方面,巧妙的應用了新媒體的營銷,經過微信朋友圈來製造營銷事件,讓你們都在討論同一款產品仍是很有新意。另外有海外網站能夠經過電腦攝像頭來觀察分析用戶的表情變化,來蒐集用戶的反饋。
2小時的分享讓A以爲整個分享環節有些枯燥,往後A在作現場分享的時候也體會到了演講的藝術,不光是拋給聽衆我要講的東西,還要可以調動現場的氣氛讓聽衆在不知不覺中接受所講的內容,特別是充足的準備是必要的。
Q&A1小時的時間,有作淘寶店提問的,有作外貿提問的,有作母嬰零售提問的,A停下來感受雖然他們都是在作零售行業,但都沒有一個系統的零售行業培訓。或者說他們都渴望經過數據來改變目前的店鋪或平臺現狀,而殊不知所措。
5點半你們選擇了附近的一家飯店去吃晚飯,翟哥正式邀請A下個月來作下分享活動,A想若是準備準備應該沒有問題。
在接下來的一年中,A和翟哥、朱哥成了很是好的朋友,一塊兒組織活動、一塊兒作網站、一塊兒作項目、一塊兒週末周邊遊。A也沒有想到,本身就這麼搞分享活動漸漸愛上了組織活動,去南京、去杭州、去北京、去深圳作了不少次分享。這個行業的或多或少的人也都認識了A。而A本身心裏深度也很是喜歡這種分享本身的想法、經驗和思想。
-----------------2015.9.26更新-----------------------------------------------------------------------------------------------------
翟哥送了本車品覺的《決戰大數據》給A,A也是火燒眉毛回到家大快朵頤。
全書從爲何大數聽說起來容易作起來難出發,以大數據構建將來商業利器結束,總共花費了11個章節,中間穿插着其在阿里的數據實踐經驗,A結合本身的讀書體會,特將其總結概括爲如下50條:
一、大數據歷來都不是免費的午飯,由於數據來源渠道的寬泛,不免出現偏倚偏差。
二、人的斷層是是大數據應用面臨最嚴重的問題,這個斷層包括溝通的斷層、建模的斷層,譬如如今收集數據的人不知道將來使用數據的人要什麼?建立模型的人不知道將來數據是否穩定,使用模型的人不知道數據的前因後果。
三、從數據化運營到運營數據,是從看到用的過程。這個過程須要主動管理,須要更多的創新,須要學會問問題,問問題的過程就是尋找答案的過程,好的問題就是答案。
四、從商業角度講,大數據的本質就是還原用戶的真實需求。
五、數據價值的如何斷定?首先看這個數據與你的目標是否一致,對你的價值是什麼?其次看這個數據可否清楚的識別用戶身份,以及反應出的對應的場景。
六、學會雙向思考,關於數據的價值,對於企業而言,是實現企業資源的合理分配,而對於用戶而言,則是對用戶體驗的提高改進,好比個性化的推薦系統就基於此。
七、場景與還原並行,前端還原爲消費者場景,後端還原爲業務需求。
八、數據的本質是還原,落地可能表現爲收集元數據的方法,我的建議初期引入最小數據集的概念。
九、關於數據還原能夠從兩方面理解:①對人的行爲目的的還原;②對製造原始信息的人的朔源。
十、活的數據纔是大數據,這裏的活主要從兩方面考量:一是靈活收集數據,抓相關性,好比咱們的克強指數;二是靈活動態的數據指標,動態的使用數據,將數據場景化。
十一、 移動互聯網時代,無線數據將是大數據的「顛覆者」。這個顛覆主要指無線數據的加入將原有數據的噪音加大,無線數據與原有PC數據的關係處理等。
十二、無線數據分爲wap和app兩種,而APP的數據收集方式又有兩種:①收集用戶聯網時請求服務器的記錄②用戶行爲記錄。
1三、 APP對用戶的識別主要基於手機的機器碼,而機器碼在不一樣系統中也有差別,差別體如今操做系統自己的差別和操做系統版本的差別。
1四、 保證PC和無線兩份數據的完整,經過用戶體系將兩份數據關聯起來,就能夠在分析過程當中用彼此的融合來還原用戶的行爲,因此用戶體系的建設在多屏時代尤其重要。
1五、 關於數據價值,從數據的角度講,估值就是經過不一樣的緯度去思考數據的價值。
1六、 數據做爲一種資產,不一樣的數據含金量必然不一樣,天然就會產生不一樣的價值,與此同時,一樣的數據在不一樣環境中也會呈現出不一樣的價值。
1七、數據的四種分類:①可再生與不可再生數據;②基礎層、中間層、應用層數據;③不一樣數據主體對應的主體數據;④隱私與非隱私數據。
1八、數據的五種價值:①串聯與識別價值;②描述價值;③時間價值;④預測價值;⑤產出數據價值。
1九、 數據分類與數據價值的意義,主要仍是體如今數據產品的創建上,其應用思想體如今基礎層-中間層-應用層上。
20、基礎層收集那些數據,如何收集,如何保存等;中間層涉及數據管理與數據框架的搭建,應用層則是八仙過海各顯神通。
2一、數據收集的出發點是解決問題,此外數據的生命週期、收集背景都須注意。
2二、 用數據是一種方法論,養數據則是一種數據戰略,是基於更深的商業解釋的商業決策。
2三、 跳出固有思惟圈,從旁觀者角度出發,跳出0或1的選擇,咱們能夠有第三種選擇。
2四、數據應用應該是小而美,而不是大而全。小而美指目標簡單具體。
2五、 如何利用數據框架作決策,簡單四步告訴你:①肯定問題,從解決問題的角度去收集數據;②整理數據放在一個框架內;③看框架與決策的關係;④根據決策行動,檢查是否達到目的。
2六、數據的盲點分爲物理盲點和邏輯盲點,物理盲點是我不知道的,邏輯盲點是我知道但沒被挖掘的。
2七、 數據也有正負能量,正能量的數據告訴你如何成功,負能量的數據告訴你如何避免失敗。
2八、是否看到數據盲點的核心價值是,有沒有看到應該看到的數據,有沒有錯失不該該錯失的數據。
2九、數據運營中的常見問題:①堵,平常報表信息量大,難以鋪捉有效信息;②獨,信息分散在不一樣部門,缺乏有效組合;③慢,業務異動的處理每每是自上而下的推進;④漏,關鍵分析成果取得實效,但未實現沉澱。
30、 阿里的大數據實踐一:數據化運營須要和商業咬合的很是緊密,因此數據也是混合在商業裏,以假定穩定的方法去作業務上的對比、細分以及趨勢預估。
3一、 阿里的大數據實踐二:假定數據是穩定的,意味着習慣於不去尋找一些新數據,用數據拿數據的方法能夠將數據化運營和運營數據打通。
3二、 阿里數據化運營的內三板斧之混:混出數據,只有具有商業敏感的分析師,才懂得使用什麼數據來驅動公司實現經營目標,數據部的人和業務部的人常常混在一塊兒。
3三、 阿里數據化運營的內三板斧之通:打通混的數據,通是混、通、曬的關鍵節點,知道帶着業務問題看數據或帶着數據看業務,這就是通。
3四、 阿里數據化運營的內三板斧之曬:曬出混和通的數據,數據能不能作到獲取、使用、分享、協調、連接、組合之上,讓本身變得超級簡單和便捷,這是數據化管理運營中很是重要的一點。
3五、 數據化運營須要有框架可依,作到如何證實業務是好仍是很差,而這裏的框架就是一個對業務進行指標化的分解,並經過有限多個指標來客觀描述業務的情況。
3六、 阿里運營數據的外三板斧之存:存是數據收集的開始,收集數據不是目的,讓收集起來的數據如何產生價值纔是最終目的。
3七、 阿里運營數據的外三板斧之管:管是保護好存儲數據,學會用數據產品來解決獲取以及使用數據的問題。
3八、 阿里運營數據的外三板斧之用:用是從收集數據到管理數據,在用數據的問題上,數據的分裂和重組,都能作到顛覆性的創新。
3九、數據思惟之MECE法則,不斷地用邏輯方法將問題進行分解,直到不能分解爲止,而後從根本去解決問題。
40、大數據的本質是人,數據研究的極點就是揣測變幻莫測的人性。
4一、假定數據是髒的,在處理數據的時候,會像污水處理廠同樣,每一步都問本身幾個爲何。這種狀況的出現,究竟是由於數據髒了仍是由於數據提驗過程當中作的很差。
4二、 作好數據的質量評分,從反映數據的可信度和質量水平出發。
4三、 學會慢慢的淡化數據,數據是有優先級的,在數據中有些是特別核心的,有些即便缺失了也沒問題,因此,咱們要學會真正坐下來盤點那些對公司最有價值,對用戶最有價值的數據。
4四、數據的標籤化管理,數據的屬性標籤是人類經驗判斷的數據,是數據後的數據。
4五、大數據價值的實如今於數據與數據之間的鏈接。
4六、數據的實時化和實時性分層,咱們千萬不要把全部能力都用來處理實時化的問題,由於咱們依然會有大量的數據須要在恰當的時機處理,有的數據是重要的,但並不緊急。
4七、關於數據,將來是人機的結合體。人和機器的結合,或者人和數據的結合將是將來的一種進步模式,人類將經過數據變得更加智能。
4八、將來,人身體中流通的不只是血液,還有數據。
4九、 關於數據分析,更準確的說法應該是信息分析,目的是尋找短板,這個短板多是本身的,也多是競爭對手的。
50、咱們都說數據分析是指導決策的重要依據,但咱們用什麼來保證分析的正確呢?是不斷的試錯仍是考驗咱們數據分析師(科學家)分析和利用信息的能力。
整體看下來,A以爲這本書很通俗易懂。也抄下本書中講到的【數據十誡】:
①好的問題,答案就在裏面。
②在實踐中提煉數據。
③讓數據變成科技,惠及更多人。
④讓數據跟着「人」走。
⑤木有數據質量,神馬數據都是浮雲。
⑥以「假定數據是能夠獲取的」去思考問題。
⑦大數據安全,不是監管。
⑧利用數據拿到更有用的數據。
⑨創建數據的數據,纔有進步。
⑩讓人作人擅長作的事,讓機器作機器擅長作的事。
在A以後的數據生涯裏,這十條戒律着實影響了A的一輩子。
-----------------2015.9.29更新-----------------------------------------------------------------------------------------------------
那年畢業回家發展的同窗們(某大拿建議說加上框架標題,接受這個意見:D)
這年,南京的「油條」(注:油條爲A在網上認識的某數據分析愛好者)發來邀請,向A傾訴道:「A,真羨慕大家這些在一線城市的。你看咱們在南京、蘇州這些鬼地方的,都沒有什麼作數據分析的,天天都停留在excel的報表中。像咱們公司是作收藏品這塊的,公司老闆也就掌握那麼幾個固定的大客戶就夠了。基本上每月的業績就是靠那些客戶來完成,公司內部也沒幾我的懂什麼是數據分析。我也就是常常在羣裏和大家這些人聊了才知道大家天天都在作什麼?何時來咱們這邊作作分享哈?」
A在平時的羣裏看到你們也就常常聊聊一些不着邊際的話題大概也都能感覺的出來,二線城市數據分析師的「迷茫」。或多或少,也是由於沒有那樣的環境,做爲一個小企業而言,不多會把重點放在數據能力的建設上。而特別在二線城市那些強調企業成本的狀況下,更多的公司會選擇成本更低、資歷更淺的候選人。
A也感嘆道:「大家在二線城市的也不知道一線城市的痛啊!天天朝九晚五,花在路上的時間就有二、3個小時。平時工做都很忙,每天被領導壓榨,每天揹着KPI,若是完不成就要滾蛋,根本就沒有幸福感可言哈!」
「因此在哪兒都很差混啊!」油條說道。「那您什麼時間能夠來南京組織下活動分享分享唄!」
A思考了片刻,仍是答應了,「這個月底要不咱們來組織下?」
「太好了,咱們在羣裏組織下。把南京的小夥伴們都叫上,看看他們都有哪些想法,而後把場地和設備都搞定了。」
你們聽到要在南京搞數據分析的聚會,都感到很興奮。
A有一種你們回到校園時代的感受。這種似曾相識的感受很珍貴。特別是在職場呆過幾年以後,看過那些不堪回首的種種,很但願那種人與人之間的純真。也作數據的時候也是,數據必定程度上反映了客觀事實,而這每每會和人與人之間的利益關係相沖突,有些數據該不應說,有些數據能不能看,幾年的感覺讓A以爲有些事情仍是不知道的好。
A想,既然要搞次聚會,就不要人太多,避免過往歷史經驗教訓人多嘴雜,意見不統一。大概約定控制在30人左右。安排油條負責你們的報名工做,看下具體定在什麼時間比較合適。超出A的意料,整週的報名人數也就22我的。這有些打擊到A的信心,另外一方面也感覺到二線城市的數據分析師的窘境。
回憶起當時本身的大學同窗,那些回家發展的,不少都是但願可以穩定、不要有太多冒險走南闖北的。像和本身以前的室友SWC,大學一畢業就回了蘇州,找了一份簡單的銀行工程師的工做,平時的生活也很溫馨,週末就宅在家裏看上網看電視。日子也算過的不錯,父母親也但願他能早點結婚。SWC對於這樣的生活節奏也習覺得常,日子久了看看那些在一線城市的同窗也會有些無聊。
也有回家繼承家業的同窗WY,其父親是一家紡織工廠的老闆,但願WY可以回家幫忙。天天的事情就是幫着家裏的生意打理着和客戶之間的關係。日子過的有些小忙,不過也沒什麼壓力。每一年也算有個幾十萬的純毛利。
還有個同窗LJ,畢業來了上海,在上海一家廣告公司作了兩年銷售,那年在2月14的情人節,和一個一塊兒上班的女孩子兩我的在一塊兒逛街的時候忽然哭了起來,說壓力好大。本身來上海也幾年了,感受本身是一無全部,又很差意思回老家工做,老家的不少人據說她在大上海有份很體面並且薪水不菲的工做,但是不少老家的人不知道這份錢和大上海的房價比起來只是杯水車薪,當時她哭着說想回家,安安靜靜的找份工做過簡單的生活。由於沒有找到合適的男友,回家還有個想法就是在家找個男友。後來有位大姐安慰她:女孩子不必在外面風風火火的打拼,到頭來只會讓你以爲很累很累,並且通常也不會找到你想要的成就感,你須要一份穩定的工做,在年輕的時候享受你的青春,想結婚的時候用心看用心尋找一個愛你的男人。當時LJ仔細想一想,人有的時候就是這樣,有不少無奈。後來LJ回了老家,過的貌似比在上海開心不少。
在二三線城市當然沒有一線城市那麼廣闊的機會,而如今爲了引進人才二三線城市也提供了不少優厚的福利給高新人才還有更輕鬆的居住環境。而但願可以年輕的時候拼搏一下的話,一線城市無疑是更好的選擇。
-----------------2015.10.12更新-----------------------------------------------------------------------------------------------------
|互聯網金融真的來了
這一年對於A來講,有款產品對A影響很是深入。天天A都會在內心計算着今天有多少收益,天天看到本身的支付寶上能有10塊錢的收益,內心就別提多高興了。要知道A平時爲了省錢,早上幾塊錢的包子和坐公交的錢都省了。
而A不知道就在這一年的前幾個月,在杭州支付寶大樓裏有個叫「春秋書院」的閉關室,立馬有一羣緊張而興奮的年輕人在忙碌着。項目室巨大的落地窗前,站着一個面色凝重的人,他就是天弘基金創新事業部技術負責人樊振華,一個在金融IT領域有着豐富經驗的老兵。他看着窗外川流不息的汽車,深深地吸了一口氣。
這是一個只有代號但沒有名字的保密項目,內部稱之爲「2號項目」,2號項目的旺旺交流羣的簽名上寫着「2013支付寶祕密武器」,足可見這個項目的重要性。
截止到今天,中國近億人由於這個項目受益,改變了本身的理財習慣。這個神祕的項目,就是餘額寶。那麼餘額寶的初期業務背景是什麼呢?由此引起出對IT系統建設的需求又是什麼?
餘額寶的業務背景
在支付寶上賣基金的想法,在天弘基金電商負責人周曉明心中通過屢次的思考和錘鍊,已逐漸清晰。他在向阿里小微金服集團國內事業羣總裁樊治銘介紹餘額寶模式的雛形時,準備了5分鐘內容,但只講1分鐘後,雙方即達成一致意見能夠作、快速作,並指望餘額寶能在6月上線運營。
雙方隨即行動起來,進行了簡單的分工,支付寶負責餘額寶在支付寶端的建設工做,而基金公司端負責與支付寶對接的直銷和清算系統的建設重任,就落到了樊振華頭上。
這是一個歷來沒有人作過,也沒有人知道該如何作的創新業務,面對支付寶巨大的用戶羣體,在僅不足3個月的時間內,該如何設計基金的清算和直銷系統,成爲了樊振華面臨的頭號難題。
2013年3月,樊振華一行與支付寶技術方進行總體架構溝通,這是傳統金融行業建設思路與互聯網技術路線的第一次衝突,雙方在閉關室足足討論了4天,肯定下來一期系統的建設目標和要解決的問題。
當時主要面臨如下難點。
1. 要能支持「千萬級」用戶的系統容量。
(1)傳統的基金銷售系統主要是和第三方銷售機構,如銀行理財專櫃、網上銀行進行合做銷售。直銷系統可以處理天天幾萬到幾十萬個用戶的開戶就徹底夠用了。但「餘額寶」面對的是數以億計的支付寶用戶,用戶的開戶數量和併發量與傳統業務有數量級的差別。
(2)傳統基金的TA系統面對的用戶是以理財爲目的的申購和贖回,所以天天清算的交易筆數要求也只有幾萬到幾十萬便可知足。但餘額寶的業務模式裏,支付寶用戶的每一筆消費,都會轉化爲一次基金贖回,又加上海量潛在用戶羣,每日清算筆數將會是傳統模式的百倍甚至是千倍。
2. 直銷系統和TA系統的融合。
傳統的直銷和TA是分別獨立的系統,但對於接入支付寶這種入口交易空前頻繁、數據量極爲龐大的需求而言,傳統的分離式文件交互方式不能知足效率和優化利用資源的要求。所以,項目組提出了功能整合、功能簡化、當前庫和歷史庫分離的技術結構。讓直銷和清算系統使用同一套數據庫,來避免數據拷貝帶來的業務時延。
3. 7×24小時的基金直銷系統。
因爲渠道的緣由,傳統基金直銷系統的大多數開戶出如今銀行的工做日。所以系統能作到5×8小時便可知足大部分客戶的需求。但互聯網的屬性是7×24小時,所以系統也應具有7×24小時不間斷的服務能力。
4. 支付寶與天弘基金雙方的數據傳輸與系統交互。
餘額寶的直銷和清算系統會部署於天弘基金在天津的數據中心,而支付寶的「餘額寶」系統部署在杭州,雙方之間的通訊協議,遠距離數據傳輸面臨很大的挑戰。
這樣,根據早期建設需求,餘額寶一期系統的架構和系統容量規劃展開了序幕。
一期系統建設
距離上線時間只有不足3個月,樊振華和系統開發商金證科技的技術人員進行了緊張的架構工做。通過數次討論,雙方有了初步的統一意見,並造成了建設目標。
1. 基於傳統的IOE基礎架構。
在如此短的時間內,有不少功能優化、業務流程更改等開發工做,再配合相關的測試,控制改動的範圍。所以基礎架構決定採用傳統的HP/IBM/Oracle/EMC方案,靠使用高端硬件設備的方式,提升一期系統的總體容量和性能。
2. 直銷和TA的系統整合。
(1)爲減小直銷系統和TA的數據傳輸延遲,決定兩個系統使用同一套數據庫架構。
(2)爲避免單點故障引發的業務中斷,應用層的直銷和TA平均分佈在每臺服務器上,確保每一個應用服務器的角色具有可替代性。
3. 跨省的MSTP專線鏈路。
天弘基金清算和交易中心在天津數據機房,經過架設兩條4M的MSTP專線,鏈接到支付寶杭州數據機房。兩條專線之間互爲備份,確保通訊鏈路安全。
一期系統的架構如圖1所示。從中可見,支付寶實時開戶、申購和贖回等實時請求,與天天的離線對帳文件,都經過MSTP專線與一期系統進行通訊。其中實時請求經過RADWARE硬件負載均衡分發到兩臺前置機,前置機在作完報文解析後,將請求發送到XP的消息隊列。而後由BP以主動負載均衡的機制,從XP中取出相應請求進行處理,處理結果保存到後端數據庫中。
![](http://static.javashuo.com/static/loading.gif)
圖1 一期系統構架圖
幸福的煩惱
然而,在一期系統上線之後,面對業務量暴增的狀況,系統遇到了瓶頸同時也出現了新的問題。
2013年6月13日,一期系統如期上線,業務量遠超預期,給系統來了一個「下馬威」。上線後數分鐘內就達到了18萬的用戶。在2013年6月18日晚上,餘額寶的用戶量已突破了100萬。2013年6月30日,餘額寶用戶數達到251.56萬。
在如此高速的業務增加壓力之下,一期系統開始面對史無前例的直銷和清算壓力的衝擊。這個新建的系統,是否能支撐起如此大的容量衝擊?何時系統會達到瓶頸?這些問題,懸而未解,讓樊振華陷入了深深的危機感中。通過了數個失眠之夜後,他還沒找到解決問題的辦法,但他清楚地知道,再這樣下去,一期系統將會很快面臨瓶頸,成爲業務增加的絆腳石。
樊振華的擔心很快變成了現實,隨着用戶量的暴增,數據庫的負荷愈來愈高,實時請求的響應時間開始變緩。清算時間由最初的半個小時慢慢地變成一個小時、兩個小時、四個小時……清算系統天天會在凌晨收到支付寶最後一筆確認文件後開始清算,天弘基金的後臺運營人員會等候清算出結果之後,發送給監管行和支付寶。隨着這些人回家的時間愈來愈晚,抱怨聲開始出現,樊振華的壓力也隨之增大。
系統的擴容勢在必行。然而,當樊振華收到金證科技發來報價表,打開第一頁時,他驚呆了。若是依然使用IBM/Oracle/EMC的傳統架構進行擴容,要達到預約目標,僅僅硬件設備採購及中間件的Licence費用就達到了數千萬元人民幣。這個數字對於樊振華來說,甚至對於天弘基金這家公司來說,是一個天文數字,超過了這家公司以往全部對於IT投資的總和。而且設備採購到貨就要一個月以上,想在一期系統瓶頸出現前完成擴容幾乎不可能實現。
傳統的路線走不通,就要找新的方法。當他得知阿里雲計算做爲一家雲計算服務提供商,使用雲計算支撐了海量的互聯網企業及阿里集團自身業務時,樊振華開始和阿里雲計算進行接觸。2013年7月,樊振華組織阿里雲、支付寶、金證科技的人一塊兒探求解決方案。最終通過慎重思考,樊振華心一橫,說了句:「不要再討論了,上雲,上阿里雲!」
上雲吧,騰飛
上雲之路,困難重重,舉步維艱。
上雲並不是一句話那麼簡單,使用雲計算支撐當時國內最大的基金直銷和清算系統,前無古人,但開弓沒有回頭箭。樊振華召集了支付寶、阿里雲、金證科技的人一塊兒,啓動將直銷和清算系統總體遷移到雲計算架構的二期系統。
阿里金融云爲二期系統提供了的雲計算服務有ECS(彈性計算服務)、RDS(關係型數據庫服務)和SLB(負載均衡服務)。這三個服務分別對應於一期系統中的HP和IBM服務器、Oracle數據庫和硬件負載均衡設備,但這三種服務的單個實例的性能和容量,都比相應的物理設備小上一大截。如何用單機性能更小的雲計算服務來支撐那些單機性能更強都難以支撐的系統呢?通過深刻的瞭解,樊振華在心中已有了答案:「蟻羣戰術」。
俗話說「三個臭皮匠,頂個諸葛亮」。「蟻羣戰術」就是要充分利用雲計算服務的快速部署能力(5分鐘內能夠建立數百臺ECS)、彈性伸縮能力和安全穩定等特性,使用水平拆分算法將應用系統水平拆分爲數十組甚至上百組平行運行的小系統,這些小系統組合起來能夠支撐起海量的請求和超高的性能。
此時已進入到2013年7月中旬。按照對一期系統運行情況趨勢的評估,一期系統的容量在沒有任何運營推廣活動的狀況下,只能支撐到9月份便會面臨瓶頸。在理清楚二期系統的性能和容量設計目標時,樊振華又接到了新的壓力:天弘基金和支付寶管理層已決定餘額寶要參加阿里「雙十一」購物狂歡節,這對於支撐後臺的技術人員來說,絕對是一場惡戰。很快,傳來了支付寶對天弘提出的雙十一支撐要求:
1. 實時請求的響應要超過1000筆每秒;
2. 清算系統要支持單日3億筆交易清算,清算時間不得超過150分鐘;
3. 2013年10月份支付寶會展開相關運營活動,系統必須在10月份前上線。
面對這樣嚴酷的要求,且只有兩個月的系統改造時間,項目組遇到了巨大的困難。
1. 如何進行系統水平拆分?
按照「蟻羣戰術」,須要將原有系統的業務邏輯水平拆分紅多組小系統。而如何才能保證拆分儘量平均和拆分後的擴展性是繞不過去的難點。水平拆分依據哪一個字段來拆分,須要根據業務特性慎重考慮。一個細節考慮不到會致使全盤皆輸。
2. 將Oracle替換爲MySQL。
不管是單機性能仍是功能,MySQL都沒法與單機的Oracle匹敵。使用MySQL代替Oracle,原有的存儲過程該怎麼辦呢?一些涉及多表join的操做在MySQL下執行效率較低該如何解決?工做量有多大?沒人清楚這一系列問題的答案。
3. 數據遷移工程浩大,難度極高。
一期系統部署在天弘基金在天津的數據中心,而二期系統卻部署在阿里雲在杭州的節點,如何作到無縫割接?而且考慮到互聯網用戶的用戶體驗,一期系統和二期系統在上線期間,不容許出現業務中斷,項目組必須在大數據量、異構環境、遠程遷移等複雜環境下,實現無縫遷移。作到上線過程最終客戶無感知。
4. 直銷和TA系統的資源爭搶問題。
一期方案將直銷和TA進行了融合,來解決數據交互問題。但因爲傳統的TA與實時請求在不一樣時段運行,因此採用了主動爭搶機制的負載均衡及貪婪式的CPU佔用,以保證充分利用硬件資源完成業務清算。這在傳統模式下沒有問題,但一期系統進行合併之後,TA和實時請求的應用系統部署在同一組服務器上,每次TA系統啓動清算的時間段,會嚴重影響實時請求的響應時間,甚至形成響應失敗。
5. 整個架構保持兩年以上系統擴容能力。
上雲後的系統必須可以知足業務量飛速高漲的狀況下,能夠根據業務量的大小作到無縫升級。兩年以內,不能由於擴容而改變系統架構。在保證擴容性的前提下,經濟和投入必須控制在合理範圍內。
這些問題,無論是樊振華,仍是金證科技,在分佈式系統和雲計算這個領域,雖然瞭解不少,但真正動刀槍,仍是第一次。即便阿里雲和支付寶的技術人員,在這麼短的時間內,要解決這麼多難題,也都不由捏一把汗。
走投無路,背水一戰
樊振華清楚本身已沒有退路,只有往前走纔是出路。他召集阿里雲、天弘基金、金證科技和支付寶的技術人員在閉關室進行封閉式開發,一場艱苦的戰役就此打響。
「管不了那麼多,這些問題只能一個一個解決。」樊振華每次面對棘手的困難時總會說這麼一句。最終困難都被解決了。
1. 系統水平拆分。系統水平拆分的基本原理很簡單,就是按一個業務字段,如支付寶協議號做爲拆分依據。對字段取哈希值之後根據拆分虛節點的個數進行求模。這樣就能夠簡單地將全部請求拆分紅多份。
在二期系統的拆分過程當中,通過測算,須要使用50組業務節點,但在拆分時,考慮到擴展性,並未簡單地拆分紅50份,而是拆分紅1000份,而後每一個節點處理20份數據。這樣作的好處是未來若是系統遇到瓶頸,須要擴容時,不須要對拆分算法進行修改,並且數據平均遷移時只須要以庫爲級別進行,從而避免了拆表。
2. 去Oracle。首先是將存儲過程等MySQL不支持或支持很差的數據庫邏輯上移到應用中。
其次要將複雜度比較高的SQL語句進行拆分,變成多條簡單的SQL語句,從而提升MySQL的執行效率。
阿里雲的RDS提供的慢SQL查詢功能,能夠將整個系統執行效率比較慢的SQL呈現給用戶,幫助用戶優化SQL語句。
3. 數據遷移。數據遷移是這個項目的重頭戲,遷移過程當中使用全量+增量+數據訂正+並行運行檢查等幾個階段完成。
二期系統在生產環境部署完成後,將在天津的一期系統的全量數據打包,按照指定拆分算法拆成1000份之後,經過專線導入到二期系統中。導入之後,將天津的一期系統前置機轉發服務打開,將全部實時請求轉發到二期系統,這樣兩個系統同時處理請求。而後,在交易日以後,以一期系統爲準,將二期系統中的數據進行訂正和補全。這些全部的操做必須在24小時內完成是遷移成功的必要條件。
數據遷移成功以後,兩個系統實際上在並行運行。須要使用腳本天天對比兩個系統中的數據,連續2週數據對比無誤之後,由支付寶將請求地址從一期系統切換到二期系統,整個遷移纔算完成。
4. 直銷和TA的再次分離。藉助雲計算快速靈活的機制,將直銷系統和TA系統的應用邏輯層進行徹底分開,分開後的直銷和TA系統分別運行在一組ECS中,兩套系統後端鏈接同一套的RDS數據庫服務。這樣既能保證TA和直銷系統在應用性能上不會發生爭搶,又不會發生數據傳遞問題。
5. 擴容性保證。除了在水平拆分算法時就採用雙重映射的機制來保證架構自己的擴容性,還充分利用了阿里云云服務能夠無縫升級的特性,來進行容量保證。
以RDS數據庫爲例,阿里雲提供了新1型到新7型等7個型號,性能逐漸加強。最終選擇了新5型做爲數據庫服務器,並無一步到位採用最高型號。這樣當系統出現瓶頸時,就能夠經過將全部RDS重新5型升級到更高型號來將系統容量翻倍。
![](http://static.javashuo.com/static/loading.gif)
圖2 二期系統構架圖
這種架構(圖2)將清算和直銷的集羣分爲兩組獨立的集羣,但使用相同的RDS數據庫服務,既避免了在應用層面的資源爭搶,又能夠作到數據的共享。其中,實時請求會先到達4個互爲冗餘備份的SLB(負載均衡),避免SLB單點故障。SLB將請求轉發給5臺前置機,前置機會按照拆分算法,將該請求路由到相應的節點進行處理,該節點處理完畢後,數據保存到改組對應的RDS數據庫。而天天的對帳文件則經過文件服務器進行拆分,而後清算系統的每一個節點主動取出本身處理的文件進行清算處理,再保存到數據庫。
歷經磨難,涅槃重生
通過兩個多月的封閉式開發,在上線以前,二期系統進行了嚴格的壓力測試,測試結果讓樊振華懸着的心終於放下了。
TA系統,能夠在6400秒內完成3億筆訂單的清算並將清算結果返回給支付寶,徹底符合清算時間不得超過150分鐘的要求。對開戶的實時請求,項目目標要求達到1000筆/秒。壓測的數據輕鬆達到5000筆/秒,而且具有11000筆/秒的儲備能力隨時可放開。
二期系統終於在2013年9月26日上午正式上線成功。在上線的前一天,一期系統天天完成清算須要8個小時,而上線當天,二期系統完成了第一次清算,只用了不到30分鐘。這個結果讓那些經歷多個不眠之夜的後臺運營人員眉開眼笑,終於能夠晚上回家睡覺了。
![](http://static.javashuo.com/static/loading.gif)
圖3 實時請求的響應時間
實時請求的響應時間老系統爲180ms,上雲之後,平均130ms,效果十分明顯,如圖3所示。
萬事俱備,只欠東風,只有通過「雙十一」海量交易量的摧殘,才能驗證系統是符合設計要求的。
2013年11月11日,餘額寶首次參加「雙十一」大促,完成1679萬筆贖回,1288萬筆申購的清算工做,成功爲639萬用戶正確分配收益。當天處理了61.25億元的消費贖回,119.97億元的轉入申購。完成這些全部的清算工做,系統只用了46分鐘。
雲計算是萬能的嗎?
這一路走來,直銷和TA系統經歷了分開、合併、再分開的演進路線,讓樊振華想起一句話「天下之勢,分久必合,合久必分」。過去這麼多年,以IOE爲主的集中式計算已告一段落,在這個互聯網的時代,雲計算和分佈式的結合代替集中式計算已深深植入他的腦海之中。
此時的樊振華,已和一年前的他大相徑庭——一年前,他還在爲各類硬件選型、採購流程而忙碌。但一年後,他更喜歡在人們面前談起的是雲計算、大數據、分佈式、用戶體驗、互聯網的IT架構等名詞。
具有強大水平擴容能力的二期系統,足以讓這個飽經歷練的老兵高枕無憂,休息一陣子,不再用擔憂系統容量和高併發的問題。但有一顆種子,在樊振華的心目中開始發芽:現在這個二期系統已不是簡單的直銷和清算系統,天天沉澱在50個數據庫裏的海量用戶和交易的數據量在暴漲,如何存儲這些數據?如何使用這些數據?該如何才能產生最大的價值?
將來如何發展?
有了這顆種子,樊振華休了個短假,他又開始了新的征程,投入了大數據的懷抱,這一次,他選擇了阿里雲提供的ODPS(開放數據處理服務)來做爲本身的大數據平臺。ODPS目前是阿里集團進行離線數據處理的平臺,支撐了阿里金融、淘寶等多家BU的大數據業務。有了這個平臺做爲後盾,樊振華清晰了不少,他腦海中復現了一幅畫面:在不久的未來,經過對目前沉澱的海量數據的分析,能夠把握上億用戶的理財需求及不一樣的風險接受能力。而天弘基金,根據這些客戶的狀況,提供更多更豐富的理財產品。或許到那一天,讓天下全部的人享受到符合本身的理財服務真不是夢想了。
-----------------2015.10.15更新-----------------------------------------------------------------------------------------------------
也正是餘額寶完全了打破了整個傳統金融的模式,給整個傳統銀行、證券基金公司、互聯網公司都帶來了巨大的影響。給像A這樣的理財小白也帶來了翻天覆地的生活變化。對此A一直心懷感恩,感謝這個時代,這個互聯網金融時代的到來。
而後互聯網金融的本質並不是名詞那麼的高大上或者使人不可捉摸,圍繞餘額寶背後的產品實際上是天弘基金髮售的一款貨幣基金,由於貨幣基金有相對很小的風險,同時收益又比傳統的按期活期存款收益高,由於受到了廣大小白的歡迎,而餘額寶的意義再不只僅是收益這麼簡單,它創造了一個時代。
包括之後的P2P、股權衆籌、產品衆籌等都陸續火了起來,互聯網金融也再也不只是完成taobao上購物支付那麼單一的功能,從本質上來講,它解決了用戶的金融需求「投資、融資、支付」。
投資:就是資金充裕的人想讓錢生錢(像傳統的存款、保險、國券、高利貸也是投資的一種方式);
融資:缺錢的人須要籌集更多的錢,融資則須要付出成本,好比借貸的利息和手續費,其實就是用錢買錢;
支付:完成交易的貨幣流動手段,金錢的本質功能。
而餘額寶就是完成了互聯網金融投資的這一步,讓資金盈餘的人都可以錢生錢。
而投資和融資都是相輔相成的,投資能夠讓錢生錢,融資能夠讓資金短缺的人籌集到錢,只有兩個功能都完成以後才能叫一個完整的互聯網金融總體。
相對的,支付能夠獨立於投融資的活動,好比咱們平時在taobao上的購物,整個活動沒有涉及到投資或融資的功能。
而咱們再反觀傳統金融,傳統的金融機構負責中介的角色,負責爲金融市場提供流動性。好比銀行,有錢的人能夠將錢存入銀行賺取利息,銀行將款項放給資金短缺的人,缺錢的人須要支付必定的利息。
而傳統金融機構或者傳統金融模式區別於互聯網的最大地方,就在於信息的不夠公開透明,不少時候在完成一筆投融資過程,須要有不少的中間方介入,也有層層環節致使融資須要支付的利息較高,投資收取的利息較低等狀況。
此外,因爲投融資自己也要承受各類各樣的風險,好比投資者擔憂資金收不回來,融資者被騙上當須要支付高額的利息等狀況。這些弊端都須要互聯網金融更好的來解決這些問題。
-----------------2015.10.21更新-----------------------------------------------------------------------------------------------------
在餘額寶出現以前,A一直都沒有關注過理財,大部分的工資收入都放到了銀行裏。但A也會以爲跑不贏CPI上漲的節奏,因此有一度也在銀行看看銀行按期存款,當時一年按期3%的收益在A心中說實話真的提不上叫理財,而銀行推出的5%的理財產品都是5萬起的,對於A來講門檻又比較高。
-----------------2015.10.27更新-----------------------------------------------------------------------------------------------------
意料以外的機遇
也就在這個時候A的同窗CJ在杭州的一家P2P公司上班,CJ給A介紹了下本身公司的產品,介紹了下P2P是什麼東西,是怎麼樣的運做模式,還有高達10%收益率的理財產品,這對於以前一直以爲8%就很高的A來講簡直難以想象。而這家公司的創始人JH也是從支付寶出來的,聽CJ講JH是浙大金融畢業的,大學一畢業就進入了阿里巴巴,那時的阿里才只有兩歲。對於這樣的過去,JH感到很慶幸,在阿里修煉了8年後,JH離職去了上海的一家支付公司發展,在上海的這家支付公司兩年裏,JH負責作B2B理財交易平臺,經過多年的互聯網經驗,JH發現了80後決定了互聯網市場需求。就如同QQ在80後的交友年代發展,網購 在80後有收入階段崛起,那麼若干年後,理財必定是有積蓄的80後面臨的最大需求。JH認爲理財B2C交易平臺將來市場潛力無限,必定會成達到萬億級的體量。擁有過兩家企業提供的大平臺和發展空間,啓動了不少前人沒作過的項目,這樣開拓性的經驗讓JH受益不淺。經歷了企業從起步到壯大,人員從幾十到幾千,JH生出了一股創業的衝動。抱着發展理財B2C交易平臺的念頭,JH離開了上海返回了杭州。開了這家P2P的互聯網金融公司。
A聽了CJ介紹了公司的背景以後,以爲這家公司應該還比較靠譜。剛開始就在平臺上買了5萬的理財產品,平均一天大約就有10多塊的收益,這比餘額寶高多了。而這時候A在新聞上看不到了很多P2P相關的負面報道,好比XX公司老闆又跑路了之類的事件。對於A來講,仍是有些擔憂這樣的風險。
觀察了兩個月以後發現這家平臺都在穩定運營,用戶數也在急速上升,A在國慶先後搞活動的此次機會又多買了10萬。有的時候風險就是與收益相互存在,結合本身評估風險的能力,再去投資本身可以接受的最大損失。
-----------------2015.10.29更新-----------------------------------------------------------------------------------------------------
這一天,一個固定電話打到了A的手機上,顯示是來自杭州的26888888。A還在家靜靜的看着電影,沒有多想就接了電話,對方是一個成熟的男人聲音,「你好,請問是A嗎?我是阿里巴巴大數據部門的負責人,不知道你最近有沒有關注阿里這邊的工做機會呢?」
在A的心底深處,一直想去阿里這樣的公司去鍛鍊下,但願可以見識下目前國內數據作的最厲害的公司都是在作什麼,怎麼作。包括之前已經耳聞目染了不少阿里媽媽、阿里雲的大牛分享的關於大數據框架、推薦、應用等各類各樣的案例介紹,聽到有人來邀請去阿里,頓時有些激動不已。
A內心有些激動,回到「是啊,以前一直挺想去阿里的,就是一直錯過了各類各樣的機會。」
那位成熟的男人繼續說道,「我也是由於咱們部門的一名研究員,關注到你的微博,以爲你寫的東西都比較有深度,對數據分析這塊也有不少思考,並且也關注到目前國內數據分析領域最前沿的技術和理念。也據說你以前也作過很多數據分析方面的網站,都效果還不錯。想請你到杭州來見面聊一聊。」
A一口答應了。
週二一早,A就坐上了去杭州的高鐵,到了東站打車直奔西溪園區。令A感到詫異的時,一路上A看到了公交車主動禮讓行人,這一點讓A對杭州留下了很深的好感。還有據說西湖的風景也不錯,但願可以面試完可以去看看。
到了西溪園區,第一眼的感受就是高大上。沒想到公司園區這麼大,果真是國內數一數二的互聯網公司。來到阿里,說實話對於A來講仍是有些小激動的。以前也在來杭州以前在網上也看了很多網友分享的關於來阿里面試的經歷,也有阿里面試負責人分享的面試中的技巧。
A本身總結在面試過程當中,通常面試官主要觀察應聘者的三方面:如今的能力如何,將來的潛力如何,以及人品如何。第一因素是最重要的,由於後面這個很難在面試第一次就能一眼準確的判斷出來,包含太多的人爲因素在裏面。因此如何想作好面試的準備的話,建議把「如今的能力如何」這方面好好準備一下,把本身以前作過的項目、案例和成功的數據分析總結一下。以前A有個同窗,能力很強,筆試和初試評價都很高,最終終試的時候評價特別低,就是被判斷以爲潛力不夠,沒有鑽研精神,對新技術新領域沒有興趣,不肯意深刻思考,不肯意主動學習。
總有同窗會問相似的問題:大家公司是否是特別看重學歷和畢業院校,是否是隻招211,985高校的學生?我第一次聽見這些問題還好,後來常常聽見相似問題。
我發現一個規律:問這些問題的人,必定不是985或者211高校的學生,並且問這些問題的人,心裏又有着無限的自卑,老是以爲別人會看不起本身。
其實換一個角度看就會明白,筆試和麪試是爲何?不就是在篩選麼?重點大學已經幫助作了一些篩選了,因此某些公司只看學校也是正常的。關鍵在於本身有實力,公司錯過了,是公司的損失。
還有應聘者很是強調本身的學習能力,說本身最大的優點就是學習能力強。在全部同窗的簡歷中,絕大部分的同窗都會寫本身的學習能力強,因此這個不要作爲一個特色。
過程當中,一再重點強調本身學習能力強的學生,通常都是能力不行的,當本身能力不夠強的時候,纔會這麼強調本身學習能力強。聰明一點的學生,都不這麼說,他們只須要講述一些例子,讓面試官得出一個結論:這個學生學習能力強,適應能力強。
不少公司面試,其實沒有筆試環節,大可能是經過簡歷篩選,而後通知面試。一些同窗但願本身的簡歷脫穎而出,搞得很特別,出發點不錯,但常常拔苗助長。由於你不知道面試官是什麼性格,你搞得花花綠綠,有人以爲漂亮,也可能有人以爲太浮躁。
若是你條件還能夠,簡歷格式仍是普通一點比較好,不要劍走偏鋒。也不要用招聘網站上模版同樣格式的簡歷,很容易被忽略掉的。比較好的簡歷,不求高端大氣上檔次,但求低調奢華有內涵。建議不要有表格,用word寫個兩頁比較合適。
內容方面也有要考慮的地方,有大面上的介紹,還要有重點的描述。把一些關鍵詞放進去,不然搜索篩選簡歷不會進入視線。而後重點介紹本身最擅長的部分,必定是最擅長的,由於面試官必定會問簡歷上的相關問題。
若是作好了,簡歷能夠作爲一個鉤子,引導面試官問你一些問題,你要是準備好了答案,在答案中再準備一個鉤子,讓面試官問下一個問題……
還有一個最關鍵點,針對你要面試的公司作簡歷修改。通常公司都有崗位描述,他們須要什麼樣的技能,你就重點描述什麼樣的技能。不要全部公司投遞的簡歷都是同樣的。
還有的同窗,除了準備點技術問題之外,其餘的一律沒有準備。不知道公司背景,不清楚公司業務,而後嘴上還會說,對這個公司很是感興趣,很是但願加入這個公司……這種人很容易就被刷掉了。其實花半個小時去了解公司背景和主要業務,哪怕只看一些新聞,也會增長面試官的好感。
若是但願加入一家公司,建議去多用這個公司的產品,關注公司所在的行業,常常看看這個公司的新聞,想辦法去認識一下公司內部的人,瞭解一些狀況。沒有認識的人怎麼辦?如今微博、微信這麼發達,甚至還有陌陌、來往,你還找不到人麼?
還有A來阿里以前,也請教了很多學長,瞭解了以前他們來阿里面試的經驗教訓,好比須要自我介紹、有什麼能夠證實你的數據分析能力強、瞭解哪些機器學習方法、爲何會選擇數據分析崗位、之後的職業規劃是什麼、以及薪資方面該怎麼去談。
到了指定的會議室,A見到了那個熟悉的成熟男人的聲音。見到本人,仍是和A印象中的形象不太同樣,面試官顯得很天然,聊了聊以前A作過的case,就聊到A怎麼堅持常常研究數據相關的技術和內容的時候,A眼中泛起了亮光,說本身對數據分析這塊特別感興趣,自己本身數學方面也是有些天賦,然而也相信數據可以改進公司的經營情況,數據對於將來社會的重要性。數據其實一直都有,只是以前沒有辦法利用起來(固然近些年的數據量也絕非10年前可比,這二者是互相促進的)。傳統來講,你們都是用數據庫存儲關係型數據,而傳統的關係型數據設計上有一些限制,好比由於一致性沒法方便地拓展。就算無論用不用數據庫分析,也大多都是單機,數據大一點也許要跑很久,海量數據就基本歇菜。並且數據一旦是非結構化的,好比網絡的訪問日誌,甚至爬蟲爬來的網頁自己,都無法很好的用傳統的分析手段有效分析。其實也不能說徹底不能,只是手段未免繁瑣,須要耗時耗力的預處理,分析起來可能也要專家經手或者難以維護。對通常的公司,那些非結構化的海量數據,相似貧礦,不是沒有價值,只是若是提煉成本大於結果,那挖掘就沒有意義了。10年前,說大型數據分析你想到什麼?銀河號計算機?基因組網格計算?都是高帥富的手段。那時候要分析海量數據,沒什麼屌絲手段。那時候分佈式計算的設計和開發模型也遠比如今MapReduce這樣的簡化模型要複雜,稱得上火箭科學。我沒有考證過是誰「開啓」了大數據時代,不過在我看來,MapReduce模型,非結構化非強一致性數據系統之類的,這些屌絲手段的誕生,讓火箭科學變得象烤串同樣人人均可以負擔得起了。你不用租銀河超級計算機,不用找專家來費勁規範化並導入數據再分析,不用設計複雜的分析軟件,不用IOE(IBM/Oracle/EMC)的產品(其實不少狀況下,數據太大,就算IOE,常規手段也撐不住的),只要經濟實惠的普通pc,買個幾百上千臺,架上hadoop,就能開挖數據了。並且MapReduce的編程模型也極其簡單,數學系統計系出身的非碼農也能隨時學會沒商量。再加上Hive之類的輔助系統,就連你家市場部妹子都能隨時敲個SQL看看當天的用戶反饋。如今的大數據,不是火箭科學,而正相反,是屌絲技術,人人都用得起的技術。正由於他的屌絲性,因此之前徹底沒法利用的貧礦,非結構化,噪音超多的海量數據就能夠被不少屌絲公司有效利用了。經過分析,你能夠挖出全部用戶的口味偏好並準實時更新推薦列表,你能夠知道搜索關鍵字的熱點變化趨勢,你能夠知道正在訪問某網站的某用戶更適合看什麼樣的廣告。這些在之前,若是不是專門花大價錢找牛人搞系統,買牛逼的ETL和分析系統,單用經濟實惠的軟硬件方案解決是沒法搞定的。這就是大數據的真正意義。若是可以對數據進行合理的開採,那就是財富,來促進業務的發展。
對面成熟的面試官聽完,心裏也被A的這股熱情感染,分享了下本身以前在大數據這塊的從業和創業經歷,以前一直在wind作股票類數據,A由於以前想經過大數據來預測股票,因此也瞭解到wind,在國內市場wind基本上包含了90%的中國證券公司、基金管理公司,wind本身也有一套大型金融工程和財經數據倉庫,A隱約的感受到之後金融領域的數據會成爲大數據的一個很熱的點。後來出來了在外面創業,專門給政府機構和朋友公司作市場調研和數據分析培訓。A說道,本身之後也想經過這些方式來推進整個數據行業的發展。
聊了大約2個小時,面試官安排HR再來溝通下,進來的HR看起來是個外表很清秀的男人,HR就聊到,以前在上家公司主要作什麼,若是能來阿里的話最快能多久到崗。A隱約的感受到面試要拿到offer的節奏,A本身也說道,若是就是不能來阿里,本身也會在數據分析這塊領域好好作,經過數據分析來改善公司的業務。HR聽完以後,直接和A說了下這個崗位的級別和薪資,問了下A還有什麼問題,A心中忽然很開心。一時半會也想不出什麼問題,表達了下感謝之情。
快到下午傍晚的時候,整個面試的環節終於結束了。A深深吸了一口氣,如釋重負,第一個給老媽打了個電話,通知了好消息。
回到上海,A面臨着一個新的問題,就是如何面向ZJM,如何說明本身的這個狀況。
-----------------2015.10.31更新-----------------------------------------------------------------------------------------------------
次日,A早上主動和HR聊了下這個狀況,HR回覆下午具體談一下。下午,HR還有ZJM,一塊兒約到樓下的咖啡廳,聊了聊,表示都但願A可以留下。A本身心裏深處去意已決,但願本身可以在阿里這樣的公司給本身更多的鍛鍊機會,因此你們聊的也很愉快。ZJM讓A作一下工做交接,而後把數據部門之後可能會怎麼發展交代一下,但願A之後多來坐坐,A本身心裏也知道,若是換了公司換了城市,就至關於換了一個新的環境,一個新的社交圈。
A把本身數據部門須要之後須要發展成多大的團隊,有多少數據倉庫工程師,多少ETL工程師,多少作算法的,多少作數據分析以及數據產品經理都和ZJM說了一下,ZJM也表示但願A能推薦一些靠譜的朋友或者同事同窗來。
辦完最終的交接和離職手續後,A眼看還有一週時間纔去杭州報道,就選擇回了一趟老家休息下。
美好的時光老是短暫的,A背起了行囊,按照行政同事安排的酒店和路程,奔赴往杭州。
瞭解杭州,就要先了解西湖。西湖名聲太大,幾乎要掩蓋杭州其他的一切,說起杭州,這是標誌性的符號。但西湖以外,畢竟還有良渚、南宋遺址、大運河,以文化眼光來看,這三項的質量都是世界級的。一、先秦的大遺址中,最受遊客青睞的估計仍是四川的金沙、三星堆,但相較之下,良渚毫不遜色,其開發、保護、展現的理念,在國內稱是數一數二並不過度。隨着良渚古城等愈來愈多的考古發現,良渚遺址已經從地域性的考古學文化類型升級成爲探討中華文明起源最重要的史前大遺址。固然,因爲良渚遺址必定程度上的專業性,其價值較難爲普通遊客所瞭解,但相信不久的未來,良渚會像西湖同樣爲人熟知。二、杭州前後爲吳越、南宋兩代都城,在國內古都中,論其建都的資歷、時間、跨度都是三流的。可是唐宋之交,中國城市形制的大變革,倒是由開封和杭州共同完成的;南北之間,經濟、文化力量對比的最終改變,杭州也可說是起到了關鍵做用。今天可見的南宋遺址恐怕很少了,能見的幾處,在視覺上並不具備多強烈的震撼效果,可是要了解一座城市,不僅是看看山水,更要看山水背後的人文歷史。三、杭州是京杭大運河的起訖點,但保存完整的遺存卻並很少見。良渚或許是死的,南宋皇城或許也是死的,西湖以一個文化的意象活在中國人的精神世界裏,那麼大運河則是實實在在地活在看得見、摸得着的平常生活裏。(申遺運河的杭州段有不少本地人不熟知的地方,除卻拱宸橋,還有祥符橋、塘棲廣濟橋、鳳山門、西興、洋關等等;前幾日去看閘口白塔,又發現一處龍山閘;西興第一次去,也是頗有風味的古鎮,周邊環境雖已無古風,但整治以後,仍是有望成爲杭城錢江以南有分量的遺存。)以遊客心態看杭州,除了西湖外,起碼還有良渚、南宋遺址、大運河這三張世界級的名片,實際上這三處也都是杭州申報世界文化遺產的項目。
可是遊客的眼光只能支撐一次兩次的獵奇遊覽,以後要靠什麼愛上這座城市,對國內不少千篇一概的城市來講,這個問題是無解的。所幸杭州仍是精緻的,在景點以外,你能夠看到不少溫暖閃光的地方。好比公共自行車。杭州是國內最先推行公共自行車的城市,發展至今,已經有了一套國內最成熟的公共自行車系統,憑藉其極高的使用率、密集的網點分佈、人性化的自助借還、低廉的使用費用(近乎免費)入選BBC評選的全球最佳公共自行車服務城市,並列的有倫敦、巴黎、華盛頓、墨爾本。可以把一個公共項目,作成世界級的水準,能和傳統的旅遊業、「時髦」的環境保護、現實的交通問題等等結合起來,給出這樣的解答,杭州是一個典範。好比免費的博物館。2004年浙江省博物館率先對遊客免費開放,成爲國內最先免費開放的省級博物館,而且在幾年之後掀起了全國範圍內的博物館免費風潮,並最終落實爲國家政策。免費不是省去幾塊錢的門票,而是在這背後,能夠看到對文化教育的重視。(浙博、杭博、絲博、良博、浙美、南宋官博都是常客,不贅述了,前日發現玉皇山下竟還有個杭幫菜博物館,山水之間,佳餚美饌,不亦樂乎。)好比一流的圖書館。每到一座城市生活,要去辦一張當地的借書卡,見過首圖、廣圖、鄂圖好幾個更新更大更「現代」的圖書館,但在讀者體驗上,沒有一個比得上更老更舊也更小的杭州圖書館,足夠的借書數量、無處不在的無線網絡、細心的照明設計、精確的圖書定位、實用的電源設計、便利的自助借還、明確的功能分區……新館造好這麼多年,沒有見到不少面子工程那種不可避免的衰敗氣象,而是一直在變得更好、更完善、更人性化,對圖書館的管理、維護,以及開放服務的理念,就目之所及,國內沒有哪個圖書館比杭圖更好。(浣紗路的杭圖老館,改造之後的老館很是溫馨,甚至比錢江新城的館區更吸引人。緣由很簡單,沒有錢江新城那種身處高樓的一本正經和嚴肅,而是隱藏在周邊的社區之中,天然純樸、很是親民。之前去澳門時羨慕澳門人有個很讚的隱藏在社區中的何東圖書館,如今以爲浣紗館也絕不落後。)好比讓路的公交車。國內不多碰見車輛在斑馬線前給行人讓路,可是在杭州,大概經歷了七十碼的慘痛教訓,交通部門花了很大的精力整治交通,今天在杭州過馬路,基本不用擔憂汽車與行人搶道,甚至在西湖邊遇到過一次公交車在對面車道上停車禮讓行人,在太多城市感覺過汽車橫衝直撞的驚心動魄以後,沒有理由不因杭州而感動。
好比運河上的巴士。運河一直是活着的,天天都有不可勝數的輪船航行其上,而杭州的幾條運河巴士線路,不只票價便宜,更讓人感到趣味的是利用文化遺產的原本功能來解決現實的城市交通問題,也正是由於這樣的水上巴士,讓人感受城市是靈動的,人與文化遺蹟之間、歷史與現實之間,是有關聯的。
另外,杭州是惟一一個時刻注目着太子灣的鬱金香、麴院的夏荷、滿覺隴的金桂、超山的梅花,而且總把這些花開花落看成新聞頭條的城市。其實要了解一座城市,要愛上一座城市,歷史底蘊、人文環境、天然生態固然十分重要,可是真正重要的是這個城市天天都有新的驚喜在等待你——你會發現有廁紙的公廁愈來愈多,發現斑馬線前愈來愈多私家車也開始禮讓行人,發現熟悉的小路旁新開了家博物館,發現圖書館的借書額度增長到20本,發現你曾經不滿的逐漸被改變,曾經期待的逐漸成現實——你會不停地發現那些日常生活中閃動的脈脈溫情,發現人與人之間的美好,感覺到人與環境之間的和諧,感覺到城市給人帶來的更可能是幸福,眼中的杭州就是一個讓人感到幸福的城市。
A到了酒店,好好在杭州休息、大吃了一頓。
次日,來到公司報道,公司HR安排了一天的入職培訓,有包含環境的熟悉、有哪些部門、有哪些規章制度、有哪些流程規範、阿里的前世此生、阿里的價值觀等課程。讓A印象最深入的就是那段淘寶小二的錄音,播放的是一個客戶很急,不停的在罵小二,而小二怎麼解決這樣的狀況。這讓A頓時以爲小二都作的很不容易,畢竟本身大學的時候也曾經試過作電話銷售,發現那段時間壓力都很大,天天回寢室倒頭就睡。而大數據開發的智能雲客服功能,這個功能真的是時代所需,太須要有這樣的服務來協助小二服務客戶,來給用戶帶來最快捷的服務指導,給產品帶來更好的用戶體驗服務。
接受完入職培訓和領完電腦和文具以後,師兄負責給A講解了下目前部門的具體狀況,目前在作的事情。A感受阿里和通常公司狀況不一樣,首先在公司的氛圍上,整個公司很熱鬧,每一個人都在忙着電話溝通或者在寫PPT或者在碼代碼,總體節奏感受比以前的公司節奏都要快。第二就是同事之間的相處,更像是大學同窗時期,相處的比較單純,討論的都是具體的業務問題。第三就是由於公司很大,因此在接觸高層的意見上感受比較遙遠,阿里的18羅漢就像是人們心目中的英雄成爲了傳說。這應該就是A來到阿里的第一印象吧。A在來阿里以前就聽你們說,阿里加班不少,阿里KPI很嚴重。來到以後,應該來講也是有本身的一番理解。
和在上海生活節奏不一樣的是,以前在上海通常6點你們就下班回家了。而來到杭州,你們晚飯基本都選擇在公司就餐,吃完出去散步下繼續回公司加班,這也許就是阿里的狀況吧。剛開始A仍是有些不太習慣,後來也漸漸適應了這種時刻保持工做的狀態。
接下來得兩個月,A開始了忙碌的工做,要開通的數據權限,須要瞭解的業務模式,認識部門的各個同事,以及要制定本身試用期大約要完成的KPI目標。杭州的數據分析交流的機會仍是比較少,阿里的數據分析交流也基本都是在公司集團內部。因此A平時在業餘的時間就趕忙把以前大神們講過的數據分析案例還有分享的分析方法、故事都學習了起來。而帶領本身的師姐,也是一個阿里的老員工,在阿里作數據分析已經有5年多,A細細觀察了師姐平時的工做,基本上也仍是在支持業務的查詢工做。這個又遇到了你們以前遇到的問題,數據分析每天須要查基礎數據怎麼辦,數據分析師成了寫SQL還有什麼出路。像這樣的狀況,A本身也在思考如何避免這樣的基礎數據查詢阻礙了本身的發展,幸虧的是,還有師姐帶領着,因此一些業務部門來的需求師姐基本上都幫A寫好了,因此A很快就掌握了一些基礎數據的狀況。而接下來主管要求A可以參與到具體的項目中去,A先找到業務部門瞭解了下目前整個大的業務發展狀況,之後的規劃和發展方向,以及如今須要作哪些工做。後面主管繼續給A安排了數據業務化、數據產品等方面的工做,A頓時以爲一會兒工做量巨大,但本身內心想象剛開始的三個月註定要辛苦一番。就這樣,A在這三個月過的很充實,也基本上沒有和外界有什麼聯繫。試用期結束,A回顧了一下本身這三個月的最大感受,就是出如今阿里價值觀裏的一條「擁抱變化」。包括時刻可能會換的團隊、同事,包括業務的發展方向,包括整個公司的組織架構變化,整個公司仍是保持着創業團隊的風格和作事,並無由於大公司的條條框框所牽絆着,而本身做爲一名剛入職的,要學會主動,沒有人會來給你安排工做,你須要本身主動去了解業務,瞭解數據,來給本身的工做作安排。這些都給A留下了深入的印象。
-----------------2015.11.1更新-----------------------------------------------------------------------------------------------------
金融原來能夠這麼玩
要說這一年什麼詞最火,無疑就是「大數據」「雲計算」「互聯網金融」,無論是傳統的銀行、金融機構,仍是如雨後春筍般發展起來的P2P、XX寶、產品衆籌、股權衆籌、股票合買、信用貸款、車貸房貸等,你們都放佛看到了這塊藍海。若是你尚未參與到互聯網金融來,感受本身都out了。
互聯網金融是傳統金融行業與互聯網精神相結合的新興領域。從廣義上講,凡是具有互聯網精神的金融業態統稱爲互聯網金融。而從狹義的金融角度來看,則應該定義在跟貨幣的信用化流通相關層面,也就是資金融通依託互聯網來實現的方式方法。
理論上,任何涉及到廣義金融的互聯網應用,都應該是互聯網金融,包括但不限於爲第三方支付、在線理財產品的銷售、信用評價審覈、金融中介、金融電子商務等模式。
而互聯網金融最先的概念提出者謝平教授認爲,以互聯網爲表明的現代信息科技,特別是移動支付、雲計算、社交網絡和搜索引擎等,將對人類金融模式產生根本影響。互聯網金融模式在將來20年將成主流。
目前來看,互聯網金融包括第三方支付、P2P小額信貸、衆籌融資、新型電子貨幣以及其餘網絡金融服務平臺。
所謂第三方支付就是一些和產品所在國家以及國外各大銀行簽約、並具有必定實力和信譽保障的第三方獨立機構提供的交易支持平臺。在經過第三方支付平臺的交易中,買方選購商品後,使用第三方平臺提供帳戶進行貨款支付,由第三方通知賣家貨款到達、進行發貨;買方檢驗物品後,就能夠通知付款給賣家,第三方再將款項轉至賣家。
目前得到第三方支付牌照的企業累計已有223家 ,其中有咱們熟知的支付寶、財付通、快錢、北京銀聯、快付通、匯付天下、拉卡拉、網銀在線、錢袋、盛大支付等。
P2P小額信貸是一種將互聯網、小額信貸等緊密聯繫的我的對我的的直接信貸模式。目前國內的P2P融資平臺有宜信網、人人貸、拍拍貸等。經過P2P網絡融資平臺,借款人直接發佈借款信息,出借人瞭解對方的身份信息、信用信息後,能夠直接與借款人簽署借貸合同,提供小額貸款,並能及時獲知借款人的還款進度,得到投資回報。
這種業務雛形能夠追溯到最先的我的互助借貸模式:北美華人社區的「標會」或「臺會」,親戚、朋友及社會團體之間經過小額信貸來解決對資金的燃眉之急。
衆籌融資,是經過社交網絡募集資金的互聯網金融模式。衆籌,就是集中你們的資金、能力和渠道,爲小企業、藝術家或我的進行某項活動等提供必要的資金援助。
衆籌的興起,源於美國的大衆籌資網站Kickstarter,該網站經過搭建網絡平臺面對公衆籌資,讓有創造力的人可能得到他們所須要的資金,以便實現他們的夢想。這種模式的興起打破了傳統的融資模式,人人均能經過該種衆籌模式得到從事某項創做或活動的資金,使得融資的來源者再也不侷限於風投等機構。
新型電子貨幣現在在網絡盛行,如比特幣。比特幣是一種無中央發行方的,基於網絡運算產生的、開源的匿名新型電子貨幣。不一樣於早期電子貨幣形式(如虛擬貨幣,預售電子卡)。
它起源於2008年一位網名爲中本聰(Satoshi Nakamoto)的黑客發表的一篇論文,描述了比特幣的模式。它是世界上第一個分佈式的匿名數字貨幣,只能被它的真實擁有者使用,並且僅僅一次。支付完成後,原主人即失去對該份額比特幣的全部權。它更多表明的是將來一種貨幣發展趨勢。
互聯網金融有三個核心部分:支付方式、信息處理和資源配置。
支付方式方面,以移動支付爲基礎。我的和機構均可在中央銀行的支付中心(超級網銀)開帳戶(存款和證券登記),即再也不徹底是二級商業銀行帳戶體系;證券、現金等金融資產的支付和轉移經過移動網絡進行;支付清算電子化以替代現鈔流通。
信息處理方面,在雲計算的保障下,資金供需雙方信息能夠經過社交網絡揭示和傳播,被搜索引擎組織和標準化,最終造成時間連續、動態變化的信息序列。由此能夠給出任何資金需求者(機構)的風險訂價或動態違約機率,並且成本極低。
資源配置方面,在供需信息幾乎徹底對稱、交易成本極低的條件下,互聯網金融模式造成了「充分交易可能性集合」,諸如中小企業融資、民間借貸、我的投資渠道等問題就容易解決。
總之,在互聯網金融模式下,支付便捷,市場信息不對稱程度很是低,資金供需雙方直接交易,不須要通過銀行、券商和交易所等金融中介。
在全球範圍內,互聯網金融已經出現了三個重要的發展趨勢。
1、移動支付替代傳統支付業務
隨着移動通信設備的滲透率超過正規金融機構的網點或自助設備,以及移動通信、互聯網和金融的結合,全球移動支付交易總金額2011年爲1059億美圓,預計將來5年將以年均42%的速度增加,2016年將達到6169億美圓。
2、P2P小額信貸替代傳統存貸款業務
其發展背景是正規金融機構一直未能有效解決中小企業融資難問題,而現代信息技術大幅下降了信息不對稱和交易成本,使P2P小額信貸在商業上成爲可行。
3、衆籌融資替代傳統證券業務
衆籌融資是最近兩年國外最熱的創業方向之一。2012年4月,美國經過JOBS法案,容許小企業經過衆籌融資得到股權資本,這使得衆籌融資替代部分傳統證券業務成爲可能。
將來互聯網金融將與大數據相互融合,達到與如今直接和間接融資同樣的資源配置效率,並在促進經濟增加的同時,大幅減小交易成本,簡化操做,提供一站式服務。
(1)雪球
也就是從這時候起,A纔算是真正的進入互聯網金融,瞭解到金融的另外一番面貌。身邊的同事、朋友聊的最多的就是你買了哪隻股票、最近什麼股票又跌了、有沒有什麼樣好的投資理財產品等。這些聲音或多或少的影響着A,天天A也會打開同花順,挑了一些本身感興趣的股票關注了下,後來聽到WQ說雪球不錯,WQ在雪球上有個大號,有不少粉絲。A也在手機上安裝了雪球的app。最初雪球的網站上都是些美股方面的信息,後來添加了社交功能吸引了很多大牛的到來,以及後來還能夠在雪球上直接開戶下單。
下面是引用的雪球創始人方三文的一篇介紹:
從開始作雪球的第一天起,我就經常被問及一個問題:雪球的參照物是什麼?每當被問到這個問題,我都有點爲難。好像咱們常常聽到的創業故事裏都有一個美國藍本。創始人對這個藍本進行「中國式加工」,成功作出一款屬於本身的產品。
可是雪球的確沒有美國藍本。我都有點不知道應該怎麼講個人創業故事了。因此我乾脆講講我做爲一個普通投資者的故事吧。
一名普通投資者的需求
2006年,我還在另外一家使人尊敬的公司工做,由於公司給我發了一點期權,我漸漸對投資股市產生了興趣。做爲一名股票投資者,我有兩個基本需求。
第一,我要跟蹤我關注的股票,查看它們的價格漲跌、看跟它們有關的新聞,偶爾也看幾眼分析師報告。第二,我對別的投資者在想什麼、看什麼也很感興趣,我但願和跟我關注同一家公司的投資者交流,看看解他們對公司的見解跟我有什麼不一樣、他們的信息和思惟有沒有我不曾觸及的地方。
當時我有什麼服務可選用呢?界面塞滿花花綠綠的「K線圖」的炒股軟件,根據編輯判斷而不是個人需求編排的財經新聞網站,擠滿了我素未謀面、但自稱有「內幕消息」的股民的聊天羣,以及銀行向我推銷的各類號稱能知足我「個性化需求」的投資理財產品……
我雖然接觸投資不久,直覺卻告訴我,這些服務都知足不了個人需求。
既然如此,那我爲何不本身作一個呢?
這就是我作雪球的出發點:我相信有這些需求的投資者遠不止我一個,而且認爲有更好的方法來知足這些需求。
如何個性化
如今是信息過載的時代。所以我首先要解決的,就是信息個性化的問題。
正如前面提到,我第一但願關注我感興趣的股票,第二但願關注我感興趣的人。所以信息個性化其實就包括了這兩方面:訂製化的信息(公司新聞、公告)和訂製化的投資者討論。
只關注本身感興趣的股票信息和用戶發言,無非是爲了提升讀取信息的效率。由於雪球從一開始就是一個投資的、垂直的社區,咱們有股票代碼這種自然的標準化標籤。因此咱們無非是把和某家上市公司相關的新聞、公告準確並實時地送達到用戶面前,把用戶關注的人的發言一條不漏地推送給用戶,甚至容許用戶屏蔽他們不想看的人。
這樣,經過你們已經很熟悉的 follow 匹配關係,雪球就知足了傳統財經網站沒法知足的信息個性化需求。
「有水平」的交流
若是事情真這麼好搞,也許我就不用作這件事了。完成了個性化之後,我又發現了一個新層次的需求。
事實上,幾乎全部人都傾向於只跟水平比本身高的人交流,好比你們都樂意跟微博上的「加V大號」對話、期待他們的回覆。但你有沒有想過,爲何「大號」們會願意搭理咱們這些普通人呢?
我想大概是由於,世界上根本沒有能夠用來衡量水平的靠譜標準。「水平」自己是一種主觀認知,它是動態並且個性化的。這有兩層意思:第一,沒有人可以精通全部領域,在某一領域,他不懂的、你可能正好是專家;第二,你之前不懂的,不表明如今不懂;他原來懂,如今認識可能已通過時,你正好來補充。
這也是互聯網最牛的地方,它經過「衆包」、而不是幾個專業人士來解決不少問題。
而雪球做爲一個藉助了互聯網這一優勢的社交網絡,咱們能作的是,在儘量完整客觀地呈現一名用戶的特色,而且保證用戶自由選擇的權利。你能夠動態選擇本身應該關注什麼人,經過持續和他們交流,知道哪些人最可能解答你哪方面的問題。這也許是幫你找到「高水平」的人交流的惟一方法了。
補充一句,這也是爲何在雪球,職業身份(「加V」)每每不過重要。咱們相信專業和高水平與否,並非和你的職業掛鉤的。
UGC 爲何有價值
在創辦雪球以前,我曾經從事過8年的媒體工做,這個工做,主要是靠特定的人(記者),特定的工做(採訪)去接近真相。從事這個工做越久,我對本身離真相的距離,愈來愈沒有信心。同時,信息在傳播過程當中,用戶的參與起到的校訂、補充做用卻令我驚訝以致驚喜。因此我愈來愈傾向於認爲: 信息在傳播的過程當中必定不能斷開與發佈者的連接,而最有價值的內容,每每是用戶產生的,這就是所謂UGC。
爲何UGC 必將比職業工做者生產的內容(PPC)更有潛力和價值?
讓當事人直接說話,而不是經過信息採集者轉述,能夠縮短傳播鏈條,避免信息在傳播過程當中的變形、延時;因爲信息提供者數量驚人,UGC 在空間、時間都能實現超大覆蓋,完勝任何一家有財力實力的媒體;得益於信息提供者的持續參與,他們還起到了信息篩選和動態更新的做用,完勝任何一名勤奮的專業記者。
雪球是一個針對投資者創建的社區。咱們的用戶生產內容還有一個潛在的「動機優點」——用本身的錢投資的專業投資者,相比僅僅以投資服務爲工做的人更專一,也有更強的動力去尋找高質量信息,因此更可能提供靠譜的內容。而出於「排雷」、對信息證明或證僞的須要,他們實際上也有很強的動力將信息分享出來。
仔細想一想,投資者過去之因此依賴職業工做者發佈的內容,不少時候並非由於這些內容專業、高水準,而是由於這些職業工做者把持了發佈渠道。但隨着社交媒體的興起,發佈渠道開放給了全部人,用戶生產內容的時代來了。全部人均可以說,全部人均可以選擇聽誰說和不聽誰說。
固然,UGC 的繁榮也帶來了新的問題。用戶生產內容大部分是以碎片化形式存在的,信息多了以後,咱們就發現,想看的新聞找不着,重要的公告可能漏掉了。因而雪球又用算法、經過「信息-人-股票」的連接,將有用的信息篩選留存在用戶我的頁和個股頁上。
什麼意思?簡單來講雪球作了這兩件事:當用戶訪問別人的我的頁時,他能迅速看到這名用戶最擅長討論哪些股票;當他瀏覽一隻股票的個股頁面時,他能迅速看到關於這家公司最熱門、最精華的討論是什麼。這種機制能有效的關鍵,是用戶互動行爲。用戶越多,生產的內容積累越多,雪球的價值就會越高。
雪球能幫用戶賺錢嗎?
說到這裏,你可能已經忍不住要問我,哥你說你作了個投資社區,那它到底怎麼幫用戶掙錢?
很抱歉,只能說這並不是我作雪球的初衷或願景。若是你期望能從雪球上找到一個「高人」,他告訴你買某隻股票,你買入,當即收益翻倍——那麼,我不但建議你永遠不要加入雪球,也永遠不要進入資本市場,您仍是更適合去拉斯維加斯。
有人可能對這樣的期待「習覺得常」。由於在過去很長的時間內,投資服務行業的商業模式都是基於這種不切實際的幻想的:投資者出於讓別人送錢給本身的良好願望,把錢送給了別人,因而有了無數知足這種「剛需」的投資服務機構和網站。
雪球是永遠沒法知足這種需求的,不管這需求有麼多強勁。偏偏相反,雪球的存在,就是要告訴你們,這種想法有多麼一廂情願。
說到底,我作的實際上是一個「社交投資網絡」。它不薦股,依靠用戶生產內容,讓喜歡獨立思考的投資者都聚到這裏,一塊兒研究公司、聊聊投資——這就是雪球。若是說我作了那麼一點創新,也許就是我選擇了用互聯網來作這些事吧。
哦對,這大概就是個人「創業故事」了。
雪球又融資了。
不少朋友對我表示祝賀。其實,融資沒有什麼好祝賀的,融資都是沒有辦法的事,說明沒有外部輸血公司還活不下去,不融資而公司賺錢纔是值得祝賀的。從另外一個角度看,投資人願意拿幾千萬美圓投資上線將近三年,尚未一分錢盈利的雪球,他們看中的價值會是什麼呢?我說說個人理解。
首先來看行業。雪球是互聯網在投資行業的一個應用。互聯網產品都是互聯網在各個行業的應用,好比QQ是互聯網在通信領域的應用,微博是互聯網在媒體領域的應用。
如今,特別基礎的領域,好比通信、搜索,都被大公司佔領了,如今新創業的公司,大部分都往更加細分垂直的領域發展。選擇不一樣的領域,很大程度上決定了互聯網產品和互聯網公司的商業價值。什麼是好的領域呢?通常的規律是終身需求優於階段性需求,好比交友是終身需求,結婚是階段性需求;高頻需求優於低頻需求,好比商務出行是高頻需求,休閒旅遊是低頻需求;高客單價需求優於低客單價需求,賣化妝品確定比賣書好。
我以爲投資是爲數很少的終身、高頻、高客單價需求領域。
雪球選擇投資領域以後,具體在這個領域作了什麼呢?咱們花了將近三年的時間,作了一個投資者的社區 (雪球) 。跟咱們同時期進入這個領域的同行,大部分都賣理財產品、p2p貸款去了,很快就作出了很靚麗的銷售業績。雪球作了一個百萬用戶,卻還一分錢不掙的社區,雪球是搞錯了嗎?咱們回到原點來,互聯網對於投資,到底能夠作哪些事情?在作雪球以前,我有一個簡單的分析,大概是三個事情:
交易。其實互聯網最先的應用之一,就是證券交易。如今銀行、券商的交易業務,已經全面互聯網化,新創的互聯網公司,在基礎交易方面能創造的增長值很少。
數據。包括查詢行情、數據、資訊,這過去是由鼓博、萬得、門戶網站等提供的,它的業務基礎是人力。新創的互聯網公司能創造的增長值也不夠多。
除這些以外,還有哪些投資者的強需求是互聯網能夠更好地知足或者優化的呢?我認爲是交流,這纔是互聯網能在投資領域創造最大價值的環節。
投資是一個須要極大信息量、極強的邏輯推演的事情。不管多麼高明的投資者,在做出一個投資決策的時候,都面臨着信息死角和思惟盲區。不特定的投者以前的交流,可以有效地掃蕩投資者的信息死角和思惟盲區,減小投資者面對不肯定性時的惶恐。互聯網社交產品使不特定的對象之間的交流成爲可能,而基於用戶間follow關係的投資者社區,又可以幫投資者選擇本身的交流對象,提升交流效率。雪球正是這樣一個社區。社區的建設極其艱難,它不但須要互聯網產品技術作支持,也須要定位清晰的運營。一旦社區造成規模和穩定的氣質,它就很難被模仿和超越,因此是一個比交易和數據更可能造成護城河的業務。到目前爲止,我不敢說雪球已經造成護城河,但要模仿它,確實也不是一件容易的事。
投資者之間的交流會產生後續產品:內容和社交關係。你在雪球點開每一個投資產品的頁面,均可以看到投資者圍繞它產生的海量內容,這些內容可以把投資產品的收益、風險等特徵提煉出來;你在雪球點開每一個投資者的頁面,均可以看到他關注哪些股票,喜歡討論什麼行業,交易風格是怎樣的。若是投資產品的特徵和投資者的偏好可以匹配,則交易有可能撮合成功。
頻繁的交流會產生社交關係,社交關係會產生信用。傳統的金融產品銷售都是經過某種程度上的增信完成的,好比銀行能夠說是牌照增信最後擔保人增信,線下的第三方銷售靠的是人肉增信。線上社交產生的信用,在其餘產品的銷售上已經有很好的應用案例,它必定也能夠應用在信用最爲稀缺珍貴的金融交易上面。匹配和增信作到了,離交易就是一步之遙了。因此也能夠這樣說,作社區自己並非目的,作交流也不是目的,讓交流服務於交易纔是最終目的。這是雪球已經作和正要作的事情,大概也是它的價值所在。
(2)招財寶
與此同時,常泡水木社區的A也看到了你們在討論招財寶這款產品,討論的都是招財寶變現的事情,頻繁的買入賣出能夠賺取中間差額的利息。第一,在不變現的基礎上,你就是買了一個和在銀行購買的理財產品,收益和風險至關,這個沒什麼好說的,在現有的金融背景下,理財產品是新時代的「按期存款」。第二,在變現的狀況下,注意了這一塊是產生爭議的重點了。簡單的說,變現就是你用本身購買的產品爲抵押向其餘人貸款,這裏有兩個債權關係:你和產品公司(各類保險啊基金啊);你和借給你錢的衆多招財寶用戶裏的一個。注意了,不要覺得你變現了以後就和你購買的產品不要緊了,也不要覺得你和你的債主沒有關係了!你購買的產品一直都在,直到合同期滿,對方還款還息。另外你變現的錢不是招財寶公司的,他們就是個拉皮條的掮客,從中收取佣金,只是還算有良心收得不多!那麼誰有錢借你呢?廣大的放高利貸者啊,呵呵,就是廣大餘額寶用戶啦,既然是借錢那就得還款還息咯,因此在完成變現的那一刻起,你就已是一個債務人了!
然而好景不長,如今的招財寶由於保監會的限制不得不下架萬能險產品。
(3)私募
也是在一次偶然的機會,A認識了作私募的金先生,金先生是一傢俬募公司的CEO,出來創業1年多,公司發展的很快,半年已經發展到30人的團隊,公司也從浙江搬到到上海。
金先生給A介紹了私募這塊具體作什麼。私募對應公募。公募的意思就是公開募集,好比IPO,配股、增發這些,都是公開募集。銀行吸取存款,其實也是廣義的公募。在中國,習慣是用私募來簡稱私募基金,就是所謂的PE。但是,其實除了私募基金之外,還有私募市場。區域性的股權交易市場,就是私募市場,裏面的行爲,大部分都是私募的行爲,簡單來講,就是由於不是面向社會公衆,因此就不用公開信息披露。由於私募基金先進入中國,因此你們就用私募來直接指代私募基金了。這種先入爲主,就像熱力學第1、第2、第三定律發明之後,又發現了還有一個定律,是這幾個的基礎,甚至就是溫度計的工做原理,這個定律才應該叫第必定律,可是第一已經被別人佔了,因此就半推半就的起名「熱力學第零定律」。但是第零這種排序,好高冷的行嗎,全部的人都會覺得第必定律纔是第一行嗎?這些先入爲主還能在一塊兒好好排序嗎?因此,不要高(zhuang)冷(bi),從我作起。私募應該是一直行爲的描述,就是對非公開募集的行爲描述,參與的資金,叫私募基金,活動的市場,叫私募市場,若是用私募形式融資能夠是發行私募股權或者私募債券等等。在股票市場的定向增發,也是非公開發行,也是私募行爲。
舉兩個例子:小李有一筆錢,他看到某基金公司有個在某網站宣傳某基金,以爲不錯因而投錢。這就是公募。一樣是小李有一筆錢(100W)以上,他的好友小王準備開一家基金管理公司,小王找來小李跟他說了公司投資方向(好比PE,VC,或者二級市場)小李決定將錢交給小王投資,這個就是私募了。公募私募具體其實就是指資金的來源途徑。而PE,陽光私募,VC等等是指錢投資的方向。
(4)量化交易
接觸到量化交易的時候,是在一個上海的數據分析羣裏,有一個網友就常常曬本身的程序化交易的收益,講機器作股票交易收益穩定、風險較小。A就和這位網友聊了起來,這位網友也很熱心,介紹量化投資技術包括多種具體方法,在投資品種選擇、投資時機選擇、股指期貨套利、商品期貨套利、統計套利和算法交易等領域獲得普遍應用。在此,以統計套利和算法交易爲例進行闡述。
a、統計套利。
統計套利是利用資產價格的歷史統計規律進行的套利,是一種風險套利,其風險在於這種歷史統計規律在將來一段時間內是否繼續存在。
統計套利的主要思路是先找出相關性最好的若干對投資品種,再找出每一對投資品種的長期均衡關係(協整關係),當某一對品種的價差(協整方程的殘差)偏離到必定程度時開始建倉,買進被相對低估的品種、賣空被相對高估的品種,等價差迴歸均衡後獲利告終。
股指期貨對衝是統計套利較長採用的一種操做策略,即利用不一樣國家、地區或行業的指數相關性,同時買入、賣出一對指數期貨進行交易。在經濟全球化條件下,各個國家、地區和行業股票指數的關聯性愈來愈強,從而容易致使股指系統性風險的產生,所以,對指數間的統計套利進行對衝是一種低風險、高收益的交
易方式。
b、算法交易。
算法交易又稱自動交易、黑盒交易或機器交易,是指經過設計算法,利用計算機程序發出交易指令的方法。在交易中,程序能夠決定的範圍包括交易時間的選擇、交易的價格,甚至包括最後須要成交的資產數量。
算法交易的主要類型有: (1) 被動型算法交易,也稱結構型算法交易。該交易算法除利用歷史數據估計交易模型的關鍵參數外,不會根據市場的情況主動選擇交易時機和交易的數量,而是按照一個既定的交易方針進行交易。該策略的的核心是減小滑價(目標價與實際成交均價的差)。被動型算法交易最成熟,使用也最
爲普遍,如在國際市場上使用最多的成交加權平均價格(VWAP)、時間加權平均價格(TWAP)等都屬於被動型算法交易。 (2) 主動型算法交易,也稱機會型算法交易。這類交易算法根據市場的情況做出實時的決策,判斷是否交易、交易的數量、交易的價格等。主動型交易算法除了努力減小滑價之外,把關注的重點逐漸轉向了價格趨勢預測上。 (3) 綜合型算法交易,該交易是前二者的結合。這類算法常見的方式是先把交易指令拆開,分佈到若干個時間段內,每一個時間段內具體如何交易由主動型交易算法進行判斷。二者結合可達到單純一種算法沒法達到的效果。
算法交易的交易策略有三:一是下降交易費用。大單指令一般被拆分爲若干個小單指令漸次進入市場。這個策略的成功程度能夠經過比較同一時期的平均購買價格與成交量加權平均價來衡量。二是套利。典型的套利策略一般包含三四個金融資產,如根據外匯市場利率平價理論,國內債券的價格、之外幣標價的債券價
格、匯率現貨及匯率遠期合約價格之間將產生必定的關聯,若是市場價格與該理論隱含的價格誤差較大,且超過其交易成本,則能夠用四筆交易來確保無風險利潤。股指期貨的期限套利也能夠用算法交易來完成。三是作市。作市包括在當前市場價格之上掛一個限價賣單或在當前價格之下掛一個限價買單,以便從買賣差價中獲利。此外,還有更復雜的策略,如「基準點「算法被交易員用來模擬指數收益,而」嗅探器「算法被用來發現最動盪或最不穩定的市場。任何類型的模式識別或者預測模型都能用來啓動算法交易。
量化交易通常會通過海量數據仿真測試和模擬操做等手段進行檢驗,並依據必定的風險管理算法進行倉位和資金配置,實現風險最小化和收益最大化,但每每也會存在必定的潛在風險,具體包括:
一、歷史數據的完整性。行情數據不完整可能致使模型與行情數據不匹配。行情數據自身風格轉換,也可能致使模型失敗,如交易流動性,價格波動幅度,價格波動頻率等,而這一點是目前量化交易難以克服的。
二、模型設計中沒有考慮倉位和資金配置,沒有安全的風險評估和預防措施,可能致使資金、倉位和模型的不匹配,而發生爆倉現象。
三、網絡中斷,硬件故障也可能對量化交易產生影響。
四、同質模型產生競爭交易現象致使的風險。
五、單一投資品種致使的不可預測風險。
爲規避或減少量化交易存在的潛在風險,可採起的策略有:保證歷史數據的完整性;在線調整模型參數;在線選擇模型類型;風險在線監測和規避等。
A聽完這些,以爲和本身平時作的機器學習,算法模型都很相似,因此本身也嘗試下載了交易軟件,嘗試了一下。而後由於不是太懂,因此剛開始的策略發現有少許的虧損,A決定仍是先向這位網友多學習段時間再作具體的實測交易。
發現金融有這麼多好玩的模式後,A發覺本身對金融的理解纔剛剛入門,之前理解的互聯網金融都太偏面或者狹隘了。像目前這些傳統的金融模式都正在一點點的互聯網化,而互聯網公司也在不斷開發新的金融產品。而在互聯網金融領域扮演着重要角色的就是大數據。
在互聯網金融領域,大數據在用戶畫像識別、風險控制、保險訂價、我的徵信、信用貸款等方面都發揮着巨大的價值。
好比用戶畫像領域,大數據給每一個人都制定了一我的羣分類標籤,你多大年齡、常駐在哪裏、平時有什麼偏好、可以接受多大的資金風險、平時都是什麼時間上網這些在我的信息庫都會有記錄;
好比風險控制這塊,你平時都是用什麼設備上網,若是你的帳號被盜或者是換了設備登錄的話,大數據能夠識別出這一風險給你提示。好比你的銀行卡密碼被盜,系統可以識別出你平時的消費習慣,針對忽然的大額消費、屢次消費給出提示和警告。再像你在給親戚朋友匯款轉帳時,大數據也能識別出你要轉帳的對方姓名是不是你認識的人,若是不是就給出提示。還有像非法的洗錢、套現、刷單這些行爲均可能會被大數據的反做弊模型識別出,避免帶來巨大的損失;
還有像保險訂價,大數據能夠根據投保人平時的出險記錄和行爲習慣,來預測未來投保人的出險機率,從而給出私人化的個性訂價。對於平時出險不多的投保人給予更多的優惠價格空間和服務。同時在投保人購買不一樣價格的商品時,大數據也能夠根據不一樣商品類目的分類來給出更低更合理的價格;
讓信用等於財富,應該是目前互聯網金融最須要解決的問題。在你們沒有面對面交流或者長久相處的狀況下,怎麼解決信任危機的問題,就須要大數據來幫忙。有一套完整的徵信系統,之後會是你們在完成第一筆交易最有利的依據。若是你的信譽很差,就會影響到你的借貸額度,甚至沒有貸款的權利。若是你的信用分很高,能夠在租房、租車、機場安檢、出境安檢等方方面面帶來巨大的便利。
-----------------2015.11.02更新-----------------------------------------------------------------------------------------------------
能力>工具
眼看A在阿里的工做逐漸走上正軌,A開始把工做的一部分時間拿來和別人的交流上。也有很多師弟師妹常常來請教A,問A平時都用什麼樣的數據分析工具,python和R的區別和聯繫,SQL要掌握到什麼樣的程度,以及SAS、clementine要用到什麼樣子纔算數據分析師入門。
A回想了一下,這些年遇到的種種狀況和問題,發覺不多有由於某些個工具不會應用而致使分析工做沒法繼續,而大部分的狀況都是業務的不瞭解致使分析無從下手。
可是掌握好數據分析工具,可以幫助一個剛入門的數據分析菜鳥快速上手,幫助沒有經驗的數據分析菜鳥理解數據分析有哪些模塊和具體的步驟。A對於沈浩老師以前整理的一篇《經常使用的數據分析工具備哪些》記憶猶新。工欲善其事,必先利其器。沈老師的學習方法,通常是先學軟件開始,再去應用,再學會理論和原理,由於是老師,再去教給別人!沒有軟件的方法就不去學了,由於學了也不能作,除非你本身會編程序。
那麼在數據分析領域,都有哪些軟件分析工具呢?如何選擇呢?其實不少領域或者說分析方法都有相應的軟件工具,只要你想找就應該可以找到!
這裏我把軟件分紅縱橫四個層次的的象限圖來表達!
第一維度:數據存儲層——>數據報表層——>數據分析層——>數據展示層
第二維度:用戶級——>部門級——>企業級——>BI級
首先,存儲層:
咱們必須可以存儲數據,對我的來說至少應該掌握一種數據庫技術,固然也不必定要熟練操做,但至少要可以理解數據的存儲和數據的基本結構和數據類型,好比數據的安全性、惟一性、冗餘性,表的關係,粒度,容量等,最好可以理解SQL查詢語言的基本結構和讀取等等!
1. Access200三、Access07等:這是最基本的我的數據庫,常常用於我的或部分基本的數據存儲;
2. MySQL數據庫,這個對於部門級或者互聯網的數據庫應用是必要的,這個時候關鍵掌握數據庫的庫結構和SQL語言的數據查詢能力;
3. SQL Server 2005或更高版本,對中小企業,一些大型企業也能夠採用SQL Server數據庫,其實這個時候自己除了數據存儲,也包括了數據報表和數據分析了,甚至數據挖掘工具都在其中了;
4. DB2,Oracle數據庫都是大型數據庫了,主要是企業級,特別是大型企業或者對數據海量存儲需求的就是必須的了,通常大型數據庫公司都提供很是好的數據整合應用平臺;
5. BI級,實際上這個不是數據庫,而是創建在前面數據庫基礎上的,這個主要是數據庫的企業應用級了,通常這個時候的數據庫都叫數據倉庫了,Data Warehouse,創建在DW級上的數據存儲基本上都是商業智能平臺,或許整合了各類數據分析,報表、分析和展示!
第二,報表層:
當企業存儲了數據後,首先要解決的報表,還不是分析問題,是要可以看到,看到報表,各類各樣的報表!國內外有專門提供報表分析服務的企業和軟件。
Crystal Report水晶報表,Bill報表,這都是全球最流行的報表工具,很是規範的報表設計思想,早期商業智能其實大部分人的理解就是報表系統,不借助IT技術人員就能夠獲取企業各類信息——報表。並且不少數據庫內置的報表也是採用CR報表的開發版嵌入的!
Tableau軟件,這個軟件是近年來很是棒的一個軟件,固然它已經不是單純的數據報表軟件了,而是更爲可視化的數據分析軟件,由於我常常用它來從數據庫中進行報表和可視化分析,先暫列在報表層;這個軟件從3.0開始,如今已經有了5.1版本,兩年的時間已經到了服務器和Web方式了!
固然,若是企業有上萬張報表,須要好好管理起來,還有安全性,併發請求等,就須要有Server版;
博易智訊公司專門提供Crystal Report和Crystal Report Server版銷售和軟件服務。
第三,數據分析層:
這個層其實有不少分析工具,固然咱們最經常使用的就是Excel,我常常用的就是統計分析和數據挖掘工具;
Excel軟件,首先版本越高越好用這是確定的;固然對Excel來說不少人只是掌握了5%Excel功能,Excel功能很是強大,甚至能夠完成全部的統計分析工做!可是我也常說,有能力把Excel玩成統計工具不如專門學會統計軟件;
SPSS軟件:當前版本是18,名字也改爲了PASW Statistics;我從3.0開始Dos環境下編程分析,到如今版本的變遷也能夠看出SPSS社會科學統計軟件包的變化,從重視醫學、化學等開始愈來愈重視商業分析,如今已經成爲了預測分析軟件。
Clementine軟件:當前版本13.0,數據挖掘工具,我從6.0開始用,到了13版,已經愈來愈多的提升了更多有好的建模工具,如今更名叫PASW Modeler 13建模器了。並且與SPSS統計功能有了更多的整合,數據處理也更加靈活和好用。
SAS軟件:SAS相對SPSS其實功能更強大,SAS是平臺化的,EM挖掘模塊平臺整合,相對來說,SAS比較難學些,但若是掌握了SAS會更有價值,好比離散選擇模型,抽樣問題,正交實驗設計等仍是SAS比較好用,另外,SAS的學習材料比較多,也公開,會有收穫的!
固然,我主要是採用SPSS和Clementine,有時候就是習慣,固然會了一種軟件在學其餘的也不是很困難!
第四:表現層
最近我一直在研究數據可視化技術,一方面是由於Excel你們有需求,另外一方面就是我第一個購買了Xcelsius,也寫了《Excel高級應用與數據分析》和《數據展示的藝術——Xcelsius》。這個領域的軟件,特別是一些小工具很是有價值!
PowerPoint軟件:這個沒得說了,大部分人都是用PPT寫報告;
Visio、SmartDraw軟件:這些都是很是好用的流程圖、營銷圖表、地圖等,並且從這裏能夠獲得不少零件;
Swiff Chart軟件:製做圖表的軟件,生成的是Flash;
Color Wheel軟件:配色軟件
Yed軟件:網絡關係圖、流程圖和圖形分析軟件,相似SNA分析,我常常用來設計流程圖,還有就是分析優化關係圖;
Netdraw軟件:這是社會網絡分析展示軟件,主要是可視化網絡關係圖的,讀取Ucinet軟件;
Mindmanager軟件:思惟導圖,很是好的軟件,能夠把非線性思惟很快構建起來,而且項目組織管理、報告設計構想均可以應用,直接生成PPT等,固然這個軟件功能很是強大,個人學生都用它來作筆記和會議記錄;
Xcelsius軟件:Dashboard製做和數據可視化報表工具,能夠直接讀取數據庫,在Excel裏建模,互聯網展示,最大特點仍是能夠在PPT中實現動態報表;這個是我最但願應用的一個軟件工具,很是有價值!
在掌握完工具以後,可以區分一個資深數據分析師和一個數據分析菜鳥的區別是什麼呢?
從上圖能夠看出,在成長爲數據分析專家以前,更多的是須要可以在問題識別、分析規劃、數據獲取、展示演示、價值應用、執行和管理能力、以及影響力上有不一樣層次的要求。做爲一個剛入門的數據分析師,須要可以把在數據分析的基礎技能上夯實。掌握基本的數據分析知識(好比統計,機率,數據挖掘基礎理論,運籌學等),掌握基本的數據分析軟件(好比,VBA,Matlab,Spss,Sql等等),掌握基本的商業經濟常識(好比宏微觀經濟學,營銷理論,投資基礎知識,戰略與風險管理等等)。這些基礎知識,在學校裏儘可能的學習,並且我來到了一些商學院,這樣我能夠在商業分析、經濟分析上面領悟到一些東西,加強個人數據分析能力。
在數據分析工具掌握以後,怎麼晉級到一個合格的數據分析師?這時候就不僅是掌握基本的統計知識或工具應用,須要可以獨立完成一項完整的數據分析工做,可以經過數據準肯定位業務上的問題,可以獨立完成一份完整的數據分析報告,可以嘗試將本身的分析結果講給被人聽,被別人接受和採納。
1. 學習怎麼寫報告;
首先,要有一個好的框架,跟蓋房子同樣,好的分析確定是有基礎有層次,有基礎堅實,而且層次明瞭才能讓閱讀者一目瞭然,架構清晰、主次分明才能讓別人容易讀懂,這樣才讓人有讀下去的慾望; 第二,每一個分析都有結論,並且結論必定要明確,若是沒有明確的結論那分析就不叫分析了,也失去了他自己的意義,由於你原本就是要去尋找或者印證一個結論纔會去作分析的,因此千萬不要忘本舍果; 第三,分析結論不要太多要精,若是能夠的話一個分析一個最重要的結論就行了,不少時候分析就是發現問題,若是一個一個分析能發現一個重大問題,就達到目的了,不要事事求多,寧要仙桃一口,不要爛杏一筐,精簡的結論也容易讓閱者接受,減小重要閱者(一般是事務繁多的領導,沒有太多時間看那麼多)的閱讀心理門 檻,若是別人看到問題太多,結論太繁,不讀下去,一百個結論也等於0; 第4、分析結論必定要基於緊密嚴禁的數據分析推導過程,不要有猜想性的結論,太主觀的東西會沒有說服力,若是一個結論連你本身都沒有確定的把握就不要拿出來誤導別人了;
第五,好的分析要有很強的可讀性,這裏是指易讀度,每一個人都有本身的閱讀習慣和思惟方式,寫東西你總會按照本身的思惟邏輯來寫,你本身以爲很明白,那是由於整個分析過程是你作的,別人不必定如此瞭解,要知道閱者每每只會花10分鐘之內的時間來閱讀,因此要考慮你的分析閱讀者是誰?他們最關心什麼?你必須站在讀者的角度去寫分析郵件; 第六,數據分析報告儘可能圖表化,這實際上是第四點的補充,用圖表代替大量堆砌的數字會有助於人們更形象更直觀地看清楚問題和結論,固然,圖表也不要太多,過多的圖表同樣會讓人無所適從; 第7、好的分析報告必定要有邏輯性,一般要遵守:一、發現問題 二、總結問題緣由 三、解決問題,這樣一個流程,邏輯性強的分析報告也容易讓人接受; 第8、好的分析必定是出自於瞭解產品的基礎上的,作數據分析的產品經理自己必定要很是瞭解你所分析的產品的,若是你連分析的對象基本特性都不瞭解,分析出來的結論確定是空中樓閣了,無根之木如何叫人信服?! 第9、好的分析必定要基於可靠的數據源,其實不少時候收集數據會佔據更多的時間,包括規劃定義數據、協調數據上報、讓開發人員 提取正確的數據或者創建良好的數據體系平臺,最後纔在收集的正確數據基礎上作分析,既然一切都是爲了找到正確的結論,那麼就要保證收集到的數據的正確性,不然一切都將變成爲了誤導別人的努力;
第10、好的分析報告必定要有解決方案和建議方案,你既然很努力地去了解了產品並在瞭解的基礎上作了深刻的分析,那麼這個過程就決定了你可能比別人都更清楚第發現了問題及問題產生的緣由,那麼在這個基礎之上基於你的知識和了解,作出的建議和結論想必也會更有意義,並且你的老闆也確定不但願你只是個會發現問題 的人,請你的那份工資更多的是爲了讓你解決問題的; 11、不要懼怕或迴避「不良結論」,分析就是爲了發現問題,併爲解決問題提供決策依據的,發現產品問題也是你的價值所在,相信你的老闆請你來,不是光讓你來唱讚歌的,他要的也不是一個粉飾太平的工具,發現產品問題,在產品缺陷和問題形成重大失誤前解決它就是你的分析的價值所在了; 12、不要創造太多難懂的名詞,若是你的老闆在看你的分析花10分鐘要叫你三次過去來解釋名詞,那麼你寫出來的價值又在哪裏呢,還不如你直接過去說算了,固然若是無可避免地要寫一些名詞,最好要有讓人易懂的「名詞解釋」; 十3、最後,要感謝那些爲你的這份分析報告付出努力作出貢獻的人,包括那些爲你上報或提取數據的人,那些爲產品做出支 持和幫助的人(若是分析的是你本身負責的產品),確定和尊重夥伴們的工做纔會贏得更多的支持和幫助,並且我想你也不是隻作一錘子買賣,懂得感謝和分享成果的人才能成爲一個有素養和受人尊敬的產品經理。
2. 學習怎麼以業務的眼光看待問題;
第一層:知其然咱們能夠經過創建數據監控體系,掌握髮生了什麼、程度如何,作到「知其然」。具體來講,切入數據的角度主要有這幾個方面。首先是「觀天」,觀察行業總體趨勢、政策環境影響;再是「知地」,瞭解競爭對手的表現;最後是「自省」,自身作得怎麼樣了,本身的數據表現怎麼樣。從看數據的週期上來說,「觀天」能夠是季度性或者更長的週期;「知地」按周或者月,特殊時間點、特殊事件狀況下除外;「自省」類的數據拿到的是最全面的,須要每天看,專門有人看,有人研究。在這一層上,分享兩個看數據的觀點:1.數據是散的,看數據須要有框架。怎麼看數據頗有講究。零碎的數據很難發揮出真正的價值,把數據放到一個有效的框架裏,才能發揮總體價值。所謂有效的框架至少包含兩重做用:(1)數據不少,不一樣人對數據需求不同,如CEO、中層管理者、底層員工關注的數據一般是不同的,有效的框架可以讓不一樣的人各取所需。
(2)有效的框架可以快速地定位問題所在。舉個例子,交易量指標你們都關心,若是某一天交易量指標掉了20%,那麼,業務很大可能下是出了問題,但問題到底出在哪兒呢?若是隻有幾個高度抽象的指標,如轉化率、成交人數、客單價等,是定位不到問題的。好的框架可以支持咱們往下鑽,從品類、流量渠道等找到問題所在,板子也就能打到具體的負責人身上了。這也是咱們一般所說的,看數據要落地。2.數據,有比較纔有真相。我有120斤,你說是重仍是輕呢?一個孤零零的數據是很難說明問題的。判斷某個指標增加快慢,須要選擇正確的比較對象、參考系,也就是基準線。這個基準線能夠是一個預先設定的目標,能夠是同行業平均水平,也能夠是歷史的同期數據。第二層:知其因此然經過數據看到了問題,走到這一步還不夠。數據只是表象,是用來發現、描述問題的,實操中解決問題更重要。數據結合業務,找到數據表象背後的真正緣由,解決之。解決問題的過程就會涉及數據、數據加工,還可能會涉及數據模型之類的方法或者是工具,這裏面技術含量比較高,另做篇幅介紹,這裏不展開了。
因素:一樣一個數據在A看來結論多是好的,從B看來可能卻得出截然相反的結果。不是說出現這樣的狀況很差,真理越辯越明。但假如不是經過數據找問題,而是先對問題定性,而後有選擇地利用數據證實本身的觀點,這種作法就不可取了。可事實上,咱們的身邊常常發生這樣的事情。2.懂業務才能真正懂數據。車品覺老師的博文《不懂商業就別談數據》對這個觀點做了深入闡述,這裏不展開講了。只是因爲本觀點的重要性,筆者特地拿出來作一下強調。
第三層:發現機會
利用數據能夠幫助業務發現機會。舉個例子:淘寶上有中老年服裝細分市場,有大碼女裝市場,這些市場能夠經過對周邊環境的感知,瞭解到咱們身邊有一些中老年人或者胖MM在淘寶上面沒有獲得需求的知足。那麼還有沒有其餘的渠道找到更多的細分市場呢?數據能夠!
經過用戶搜索的關鍵詞與實際成交的數據比較,發現有不少需求並無被很好地知足,反映出需求旺盛,但供給不足。假如發現了這樣的細分市場,公佈出來給行業小二,公佈出來給賣家,是否是能夠幫助你們更好地去服務消費者呢?這個例子就是如今咱們在作的「潛力細分市場發現」項目。講這個案例,不是想吹牛數據有多厲害,而是想告訴你們:數據就在那裏,有些人熟視無睹,但有些人卻能夠從中挖出「寶貝」來。差別是什麼呢?商業感受。剛剛提到的搜索數據、成交數據不少人都可以看到,但之前沒有人把這兩份數據聯繫在一塊兒看,這背後體現出的就是商業感受。第四層:創建數據化運營體系我理解的數據化運營,包含了兩重意思:數據做爲間接生產力和直接生產力。1.數據做爲間接生產力。所謂間接生產力,是指數據工做者將數據價值經過運營傳遞給消費者,即一般所說的決策支持,數據工做者產出報表、分析報告等供各級業務決策者參考。我稱之爲決策支持1.0模式。然而隨着業務開拓和業務人員對數據重要性理解的加強,對數據的需求會如雨後春筍般冒出來,顯然單單依賴人數很少的分析師是知足不了的。授人以魚不如授人以漁,讓運營、產品的同窗都可以進行數據分析,是我腦子中的決策支持2.0模式。決策支持2.0模式有三個關鍵詞:產品、能力、意願。
讓運營和PD掌握SQL這類取數語言,掌握SAS、SPSS這類分析工做,顯得不大現實和必要。提供低門檻、用戶體驗良好的數據產品是實現決策支持2.0模式的基礎。這裏講的產品,不只僅是操做功能集,還須要承載分析思路和實際案例。可是,數據分析的門檻始終是存在的。這就對運營和PD提出了新的基本能力要求,即基礎的數學能力、邏輯思考能力和學習能力。最後一個意願,也許是最關鍵的,只有心裏有強烈的驅動,想作好這件事情的時候,纔有可能作好。2.數據做爲直接生產力。所謂直接生產力,是指數據工做者將數據價值直接經過前臺產品做用於消費者。時髦點講,叫數據變現。隨着大數據時代的到來,公司管理層愈來愈重視這一點。大數據時代帶來了大的機會,但也多是大災難。若是不能利用數據產生價值,那麼,它就是一個災難——產生的數據越多,存儲的空間、浪費的資源就越多。如今比較好理解的一個應用就是關聯推薦, 你買了一個商品以後,給你推薦一個最有可能再買的商品。個性化是數據做爲直接生產力的新浪潮,這個浪潮已經愈來愈近。數據工做者們,作好迎接的準備吧。
3. 怎麼在數據分析技能上增強;
基本技術怎麼強調都不過度。這裏的術更可能是(計算機、統計知識),多年作數據分析、數據挖掘的經從來看、以及業界朋友的交流來看,這點你們深有感觸的。數據庫查詢—SQL數據分析師在計算機的層面的技能要求較低,主要是會SQL,由於這裏解決一個數據提取的問題。有機會能夠去逛逛一些專業的數據論壇,學習一些SQL技巧、新的函數,對你工做效率的提升是頗有幫助的。統計知識與數據挖掘你要掌握基礎的、成熟的數據建模方法、數據挖掘方法。例如:多元統計:迴歸分析、因子分析、離散等,數據挖掘中的:決策樹、聚類、關聯規則、神經網絡等。可是仍是應該關注一些博客、論壇中你們對於最新方法的介紹,或者是對老方法的新運用,不斷更新本身知識,才能跟上時代,也許你工做中根本不會用到,可是將來呢?行業知識若是數據不結合具體的行業、業務知識,數據就是一堆數字,不表明任何東西。是冷冰冰,是不會產生任何價值的,數據驅動營銷、提升科學決策一切都是空的。一名數據分析師,必定要對所在行業知識、業務知識有深刻的瞭解。例如:看到某個數據,你首先必需要知道,這個數據的統計口徑是什麼?是如何取出來的?這個數據在這個行業,在相應的業務是在哪一個環節是產生的?數值的表明業務發生了什麼(背景是什麼)?對於A部門來講,本月新會員有10萬,10萬好仍是很差呢? 當你掌握好前面的基本知識和一些技巧性東西的時候,你應該在業務、行業、商業知識的學習與積累上了。
這個放在最後,不是不重要,並且很是重要,若是前面三點是決定你可否進入這個行業,那麼這則是你進入這個行業後,可否成功的最根本的因素。數據與具體行業知識的關係,比做池塘中魚與水的關係一點都不過度,數據(魚)離開了行業、業務背景(水)是死的,是不多是「活」。而沒有「魚」的水,更像是「死」水,你去根本不知道看什麼(方向在哪)。
特別A在之前的數據分析工做中,區別於其餘數據分析師的一項特定能力就是對業務的看法。就連本身的業務方都認可A的業務能力比本身這樣每天作業務的人都更清楚,數據記得更清楚。也爲A之後從事業務埋下了伏筆。
--------------2015.11.11
目擊BAT的大數據故事
一次偶然的機會,A有幸參加了整個數據圈舉辦的大數據峯會。這一天來自各個公司的大拿都齊聚大數據,針對商業智能、移動互聯網和互聯網金融領域的應用和大數據的發展走向做探討。
首先是阿里的某位數據泰斗上臺分享大數據的歷史,現狀和將來發展。講訴了這幾年大數據如何是從天天幾G的數據量到攢下超過100PB已清洗的數據。
從2003年淘寶起步開始,阿里集團數據事業部負責人QG就一直和數據在打交道,他的經歷勾勒了這家數據巨人的演變軌跡。
阿里系最先的數據工做自2003年起步,出於業務需求的驅動,起步很是粗糙,無非數據庫、IT系統,隨後開始統計分析行業的基本指標,好比UV/PV等,當時的淘寶數據員工也只有數名。
在數據的童蒙時代,淘寶「依葫蘆畫瓢」,學習當時最大的對手-ebay,當時的ebay和亞馬遜都已經成立了BI部門,恰是與易趣的競爭,推進了整個阿里的數據發展。據淘寶當時的相關人士回憶,易趣曾強勢經過排他協議壟斷了門戶廣告資源,迫使阿里將廣告投放轉向中小網站聯盟,由此催生了廣告投放精準化的分析需求,淘寶的數據分析團隊開始積累流量數據的分析經驗。
04年~05年是淘寶逆襲的一年,這一年業務量突增,品類也擴張的很迅速,數據量隨之躍升。淘寶開始意識到不能再靠拍腦殼決策了,須要實時掌握用戶量和交易量的變化,進行精準分析。
05年淘寶成立了BI部門,成爲當時淘寶技術研發部門JP的直屬部門,這一年,阿里擁有了第一款嚴格意義上的數據產品——「淘數據」,這是一份經營數據的報表,爲各業務公司、部門提供經營報表的檢索生成工具。同年,阿里切入搜索、廣告業務——兩項業務均帶有自然的數據屬性,成爲阿里大數據運營的開端。QG講這個由此阿里對數據和應用場景的理解愈來愈清晰,目標愈來愈明確——搜索幫助消費者更快找到商品,廣告則讓商家得到更高的ROI。
09年阿里數據進入產品化的時代,「淘數據」從一個內部報表系統變成了內部數據的統稱。09年4月和12月,BI又分別開發出可預警的「KPI系統」、服務業務部門的「數據門戶」。
阿里對外的數據產品也開始浮出水面,脫胎於「雅虎統計」的「量子恆道」,爲外部商鋪提供了統計分析工具,用於跟蹤自有店鋪的流量、點擊、購買等數據的變化狀況。
與數據產品的大裂變同步,09年阿里的數據技術架構,開始大變革。此前一年加入阿里出任首席架構師的WJ,一手主導了阿里架構從oracle商用系統向hadoop開源平臺的遷移。相比較IBM、Oracle等商用系統,hadoop的優勢在於成本低廉,且架構可擴展性極強,全球互聯網企業的大規模計算體系多使用該平臺。
同年,WJ成立阿里集團研究院,將集團內各公司自行搭建的hadoop集羣統一,開發出「雲梯1」系統,以實現全集團的全部數據打通、整合的管理與分享。
這一系列變革以後,阿里最高層提出了「數據開放」。10年初,淘寶推出了「數據魔方」,第一次向市場開放了全局市場數據,這款付費產品成了大中型商戶追捧的利器。產品研發出於對客戶的走訪瞭解。當時,寶潔公司但願可以瞭解到行業數據,以幫助其經營決策。數據團隊的員工提出,與其case by case解決,不如直接產品化,阿里的數據價值出來了。
此後阿里的數據產品開發進入了井噴階段,淘寶數據部門開發出「活動直播間」,幫助賣家更好的參與促銷運營。11年上半年,「賣家雲圖」「頁面點擊」接連出現。
11年,現任阿里數據委員會負責人的CPJ加盟支付寶,發現阿里數據產品線存在不少短板:高層一端數據過多,關聯性不強,難以快速而且進行全局診斷;一線運營一端總抱怨數據不夠,數據間壁壘重重,沒有進行整合。因而CPJ研發了兩款數據產品,「觀星臺」:高度可視化的儀表盤,選擇最關鍵的數據在幾秒內展現全局運營情況;「地動儀」:能夠看到用戶投訴的最多功能有哪些,甚至能夠獲取最原始的客服錄音電話錄音。隨後,CPJ進入淘寶,又研發了兩款產品「黃金策」「無量神針」。QG領導的另外一支數據團隊也研發了一系列的產品,「淘寶指數」「淘寶時光機」。
一家互聯網公司數據挖掘業務的負責人評論,從「數據門戶」到「數據魔方」,再到「淘寶指數」「淘寶時光機」,阿里的數據產品從報表到數據工具,再到可視化圖片,甚至一組Flash,看上去愈來愈沒有「數據味」,可是其對消費場景和行爲的洞察卻愈來愈深了。
12年阿里集團一系列架構調整,重構了阿里數據「達芬奇密碼盤」的排序。
阿里雲拆分,獨立運行;阿里系的數據庫和大規模運算資源整合爲「數據平臺事業部」,由CEO LZX親自掌管;同時成立虛擬組織「集團數據委員會」,CPJ出任首任會長。
WJ領導的阿里雲是「密碼盤」中的最底層框架,提供基礎的運算平臺。譬如,阿里自行研發的「雲梯2」體系,即創建在阿里雲「飛天」架構之上;在此之上,則是QG領導的數據平臺事業部,運營阿里集團共享的數據庫,各業務公司產生的數據經清洗以後就存儲在該事業部的服務器上;再往上便是CPJ領導的淘寶網BI部門,他們使用數據進行分析。同時「數據委員會」的成員們分屬阿里各業務公司,他們利用QG團隊的工做成果進行再分析。
能夠理解爲三層架構:阿里雲便是IasS(基礎設施即服務),阿里數據平臺事業部是PasS(平臺即服務),而CPJ團隊便是SaaS(軟件即服務)。
阿里集團內的數據大多通過這樣的旅程——用戶在淘寶上的一個收藏動做,首先在淘寶網的前端服務器上產生一條日誌,日誌隨後被傳送到QG團隊的服務器上存儲,期間通過清洗過程,最後被編入數據庫,與其餘數據一同被存儲在分主題的數據集市。當數據委員會的分析師們進行數據挖掘時,就可能被採用。
目前,數據業務平臺已整合了阿里集團的所有數據,此外,阿里小微集團中創新金融事業部的數據也與該平臺直接相連。
阿里的前世差很少是這些,那阿里的此生又是什麼樣子呢?
圍繞大數據,阿里在廣告、搜索、推薦、風控、我的授信、保險、智能客服等領域也是作出了不少數據產品。
廣告方面數一數二的當屬阿里媽媽,聯盟平臺從以服務淘寶系商家爲主,轉向面向全網全部廣告主開放。好比當英菲尼迪投放了一款與寶馬Mini互爲競品的新車時,阿里媽媽會經過電商交易數據,找出對這款車可能感興趣的用戶,同時廣告主——它們有多是英菲尼迪的經銷商、也有多是但願藉機推送寶馬Mini廣告的寶馬經銷商,以競價方式競得推送廣告的權利。整個過程能夠在用戶打開網頁的瞬間完成。
這一過程都是在基於阿里媽媽剛開發完成不久的「達摩盤」,除了網頁廣告,還整合了移動、社交媒體、郵件等營銷手段。
這種RTB廣告(又稱實時競價廣告,即Real Time Bidding)對於廣告界來講並非新事物。Google曾在全球範圍內第一個推出RTB平臺。隨後跟進的包括Facebook、騰訊、百度、新浪等互聯網公司,如今這個領域還出現了品友互動、悠易互通、MediaV等衆多新興公司。
在RTB廣告交易中,廣告主按效果付費,爲了得到更多的點擊,就必須精準地找到目標受衆。
來自廣東的店主羅亦挺2014年開始使用「生意參謀」,一款阿里巴巴B2B平臺上的數據分析工具。「我能夠知道店鋪的流量來源,知道來自哪一個網站、經過哪些搜索的關鍵詞過來的。」他對界面新聞記者介紹。而且從去年下半年開始,還有了無線端的銷售金額統計。
2014年整年,羅亦挺的店廣告支出20萬元,收入爲1000萬。
阿里媽媽達摩盤還對本月剛剛上市的全新英朗進行了「全網匹配」。按其自身的統計,點擊率提升了136%,下訂金的客戶80.3%來自此案例的定製人羣。
分析和交易數據成了達摩盤的基礎。這可能也是阿里媽媽相比騰訊、百度等其它對手最大的不一樣——它有4億用戶交易的真實數據。
我的徵信方面芝麻信用經過對用戶海量數據的挖掘得出相應的芝麻分,能直觀地呈現用戶的信用水平。芝麻分的數據來源可不只來源於阿里巴巴哦。從渠道來看的話,芝麻分的電商數據來自阿里巴巴體系,互聯網金融數據則來自螞蟻金服,還有部分數據來自衆多公共機構及合做夥伴,也有用戶自主提交的數據,例如結婚證、房產證等,將來阿里係數據僅會佔30%——40%權重。
芝麻分的分值區間爲350-950,芝麻分越高表明用戶的信用情況越好。影響芝麻分高低的有身份特質、信用歷史、行爲偏好、履約能力以及人脈關係5個因素。
芝麻分應用場景分析
一、消費貸款
針對芝麻信用分,螞蟻金服本身推出了3款產品:花唄、借唄和好期貸。花唄是支付寶推出的一款「賒帳消費」工具,消費者能夠經過花唄購買產品,下月再進行還款。中申網小編查閱數據發現,花粉的用戶33%是90後,80後用戶則佔48.5%,而70後用戶只有14.3%。可見螞蟻「花唄」深受新生代消費羣體歡迎。
芝麻分達到600分的用戶有機會申領借唄,如今還未全面開放。芝麻信用用戶能夠憑藉芝麻分申請相應額度的我的消費貸款,申請到的額度能夠提現到支付寶餘額。貸款額度爲1千元——5萬元,還款最長期限爲12個月,貸款日利率是0.045%,隨借隨還。
「好期貸」是招聯金融旗下產品,門檻比「借唄」高一些,目前須要芝麻分700及以上才行,並且有每日1000個名額限制。不過6月好期貸將下降芝麻分門檻,並且將進行首度開放。好期貸額度在2千-1萬元之間,貸款期限分爲三、六、12個月,可隨時還款,好期貸的年貸款利率爲17.8%。按月計息,還款當月按日計息,還款方式爲等額本息。
此外,芝麻信用也已開始與其餘金融機構合做,把芝麻分做爲放貸的依據。好比引入芝麻信用分的玖富表示芝麻分高,能夠享受的借款額度就會更高,利率也會更低。而金融搜索平臺融360也已與芝麻信用創建數據戰略合做。融360將利用芝麻分計算放貸金額,申請貸款用戶在融360在線金融平臺上借款,最快10分鐘審批,24小時放款。
可見,芝麻信用分的推出對金融機構意義重大,不只能夠下降金融機構的貸款風險,還能夠簡化貸款流程加快放款速度。
二、婚戀
5月20日婚戀網站百合網宣佈引入「芝麻信用」。雖然百合網實行實名制,但依然沒法避免不法分子利用婚戀網站「騙婚」的問題,經過引入芝麻信用能夠增長相親雙方的信任度。百合網用戶能夠先查看對方的芝麻分了解對方的信用如何再決定是否和對方深刻發展。芝麻分的引入,可以提升單身男女對相親對象的信任感,更利於感情修成正果。
三、租房
青客公寓和淘寶房產試水租房電商模式,結合「芝麻信用分」租客還能享受房租1元的信用權益。淘寶這次推出信用抵房租活動,恰逢畢業季,正好緩解很多畢業生的租房難題。中申網統計發現,新增的求租、換租需求在畢業季的一段時間內會放大,出租房源會出現季節性供應緊張致使租金上漲。淘寶這次與青客公寓合做,將‘芝麻信用’變成了一種‘租房福利’,也是租房行業的一次大膽嘗試。
四、租車
如今芝麻分用戶已經能夠享受憑芝麻分租車服務。芝麻分達到600分可享受車紛享智能租車,無需押金還能先用車後付款。芝麻分達到650分用戶無須交押金或刷預受權,就能夠在全國700多家神州租車直營門店預訂押金在5000元如下的短租自駕產品。
6月6日起,一嗨租車也將引入芝麻信用。一嗨租車用戶只要芝麻信用分在650分及以上,同時無負面記錄,便可申請租車免預受權服務,一嗨租車根據芝麻分授予用戶5000元的免預受權額度。
五、住宿
「阿里去啊」推出了基於芝麻信用的「信用住」酒店服務計劃,600分以上的用戶預訂酒店能夠享受「零押金」入住等服務。小豬短租也聯合芝麻信用推出600分以上免押金入住服務。
未來芝麻信用分還將在購物、社交、民生等領域發揮更大的做用。因此,千萬別小瞧這個小小的「芝麻分」,未來它可能關係到你的錢途哦!
接下來是騰訊的blue介紹大數據的具體應用。
大數據,這個詞愈來愈熱,不少人都在談大數據,其實不少張口閉口大數據的人,或許都不知道數據是如何產生、傳遞、存儲、運算到應用。有段時間,看到一些大數據文章,就感受純屬湊熱鬧,小數據都沒搞明白,整天扯大數據。大數據,真的不是普通公司能夠作的。
早上9點開始到晚上18點,7個小時,都是關於數據的演講,騰訊、華爲、京東、大衆點評等公司的數據專家分別講述各自的數據理論與實踐,當天簡直是信息爆炸,我用手機拍下200多張PPT,即便原來對數據有些研究,對騰訊數據平臺也比較瞭解,要整理出來和你們分享,也須要一些時間消化整理。
曾經是騰訊內部舉辦的商業智能日,現在走向開放。
騰訊數據平臺的思路,早已熟悉,此次算複習,再次感覺騰訊數據平臺的成長,技術性已是領先水平,在產品與業務發展的指導與支撐並轉化爲生產力方面,仍有很是大的想象空間。
當天幾家公司的大數據應用,相對侷限於個性化推薦,例如廣告精準投放、推薦商品、推薦用戶、推薦應用等等。或許,國內的大數據應用因爲商業公司功利性的限制,當天幾家演講的公司,大數據的商業化目標明確,而精準個性推薦是其中最有效的手段。
騰訊大數據現狀
IBM將「大數據」理念定義爲4個V:大量化(Volume)、多樣化(Variety)、快速化(Velocity)以及產生的價值(Value)。咱們能夠從這幾個方面一塊兒看看騰訊大數據現狀。
從業務角度
騰訊數據真的夠大。騰訊數據平臺自研的TDW替換了商業數據庫,實現公司級數據集中存儲,總記錄達到375萬億條,日接入5千億條,覆蓋移動設備數7.7億。
從平臺角度看
騰訊數據平臺設備8400臺,單集羣5600臺,總存儲100PB+;日新增數據200TB+,月數據增加率10%,日均JOB數100萬,日均計算量5PB,量夠大,速度也夠快。
從用戶角度看
這裏的用戶,指的是騰訊內部員工。騰訊員工2萬多人,騰訊數據門戶的月活躍是2500左右,也就是說訪問騰訊數據門戶的人佔比公司10%+;每個月處理數據提取分析的任務數是1萬個,若是訪問者每人都會提數據任務,平均就是一我的提4個左右的分析提取任務;用戶畫像分析任務爲1.2萬,能夠看出騰訊對用戶畫像的重視程度。
騰訊大數據的多樣性
下面的圖,騰訊數據平臺已經接入100多個產品的各種數據,例如:用戶行爲、帳號屬性、收入數據等等。
騰訊數據平臺產品架構
騰訊數據平臺從五個方面進行產品設計,分別是:數據管理、數據監控、數據分析、數據可視化、數據挖掘。
這也是我曾經在騰訊、YY語作過的數據產品運營工做的主線,五個方面分別經過各類數據產品落地,爲公司內部產品策劃、產品運營、產品營收、客服、財務等提供數據支撐。
騰訊業務平臺與數據服務
下面這張圖很是清晰的闡明瞭騰訊數據平臺的數據服務與業務平臺的關係。數據服務的核心是分佈式存儲、實時計算(TRC)、離線計算(TDW),以數據產品的方式對外呈現於應用,業務平臺則考慮用戶接入、業務邏輯、關係型存儲的工做。
其中,對於海量數據來講,相當重要的是 Gaia高效的資源調度,提供高併發的任務調度與資源管理,爲實現秒級的數據監控與實時運算提供保證。
Gaia高效的資源調度
騰訊大數據應用成效
數據成爲生產力,支持海量用戶產品發展。
騰訊廣點通,精準廣告投放
騰訊信鴿——大數據精準移動推送
用戶留存率提高100%,用戶活躍提高100%。
遊戲模型,助力手遊精細化運營
自助分析
自助報表
黃金眼——快速報表
實時監控
用戶畫像
緊接着,百度研究院大數據實驗室也分享了名爲《從數據到智能》的演講,着重向業界介紹了百度大數據引擎以及大數據智能分析案例等內容。
咱們都處在一個信息爆炸的社會,咱們感知世界的方式能夠經過搜索等手段轉化成數據,在國內,百度無疑是搜索領域的領頭羊,人們天天用百度搜索,當用戶搜索行爲被記錄下來後,數據就造成了。
僅從百度的搜索業務看,做爲國內最大的搜索引擎,天天要索引天量的網頁,同時響應天量的用戶搜索請求。根據沈志勇介紹,目前百度擁有2000PB的大數據存儲能力,而且經過數據分析、數據挖掘等手段,百度天天能夠處理10-100PB的數據量。在大數據領域上,搜索引擎的數據蒐集能力,或者說產生數據的能力毋庸置疑,這也促使百度將這方面的技術運用的爐火純青,能夠說百度天生就是一家大數據公司。
其實在大數據的處理方面,智能分析已經愈來愈引發業界的重視關聯和挖掘大數據已經成了業界最爲關心的事情,不管是銀行、保險、電信,仍是傳統軟件廠商、互聯網公司、創業公司,都可以藉助大數據讓本身的生產和運營更爲順暢。
但是因爲條件所限,不少公司本身作不了大數據,正是看到了這一點,百度作爲國內最先進行大數據技術研究的公司之一,大數據技術領域「先富起來的人」,在尋找「先富帶動後富」的,但願能與整個產業界,實如今大數據上的「共同富裕」。
在互聯網時代,一個公司想要發展用戶體驗、實現商業變現、制定決策系統等,離不開大數據智能分析技術的支持。百度在智能分析技術的不少積累,尤爲是應用於廣告的超大規模機器學習技術在世界上是領先的。
「現在,百度專門成立了大數據實驗室BDL,而且百度大數據引擎還將百度大腦、百度數據工廠、百度開放雲做爲3級開放平臺開放給業界,但願可以憑藉百度的大數據技術推進整個行業的發展。」沈志勇說。
大數據的魔力從預測旅遊到預測體育
在現場,最令聽衆感興趣是分享的百度預測項目實踐。經過小夥伴們支持的百度大數據部的旅遊預測項目和世界盃預測項目向你們闡述了基於百度大數據的預測中的一些技術與經驗。
人流量預測一直是旅遊行業的一大難題,旅遊管理機構和旅遊目的地企業都渴望作到對將來「心中有數」,但是結果每每不甚理想。百度旅遊預測基於百度大數據的預測模型。一方面,百度經過其LBS產品反映了全國全部景區的歷史人流數據;另外一方面,從百度的搜索日誌中,得知用戶想去的任何景點旅遊的需求數據,以及該地在近期將舉辦的大型活動、民俗集會等相關信息,還能夠獲取對應時間下的天氣、空氣質量等數據。「這些數據一般是按照時間排列的一系列數值,這些因素對目標數值影響的效果在咱們採用的模型中被量化、系統化,進而能夠預測未來。」
百度對於人流量的精準預測獲得了社會的廣泛確定,小長假期間被央視等各大媒體做爲預測範本報道宣傳。能夠說百度預測的出現不管對旅遊行業宏觀把握和調控,仍是對目的地營銷活動的引導,以及對旅遊人流流向和流量的調整,都具備很大的現實意義。
另外一個典型的案例是世界盃預測:在2014年世界盃比賽中,包括Yahoo、微軟、Google在內的互聯網公司對比賽進行了基於大數據分析的預測。結果百度的預測是最準確的,獨冠羣雄。
除了上述的兩類預測,百度目前還與中國疾病預防控制中心進行合做,基於百度搜索數據來構建傳染病預測模型,結果顯示與病例實際數據具備極高的一致性。同時百度預測也能夠進行經濟指數預測、高考預測,而且百度還開放了預測開放平臺給業界,若是你有歷史數據,但願預測將來走勢能夠經過預測開放平臺進行預測。
大數據的將來民生、企業都能惠及的巨大價值
除了預測,百度大數據實驗室還有不少正在探索的方向,這些方向既有惠及民生的,也有服務企業,瞭解企業需求和真正「痛點」,提供完整的預測解決方案,能夠幫助企業實現智能運維/運營。
一個典型的例子是,百度基於對海量大數據的智能分析,能夠對使用百度產品的用戶進行畫像,即經過用戶輸入的搜索詞來理解用戶的意圖,從而就能實現個性化的精準廣告推薦提高用戶對廣告的點擊率和對產品的訂單轉化率。
在惠及民生的公益事業方面,近日,百度已經和聯合國簽署協議,創建了大數據聯合實驗室。該實驗室的成立意味着百度將利用自身大數據技術幫助聯合國去解決一些全球性問題。同時,聯合國把百度視爲合做夥伴,也說明了百度在大數據智能分析領域的技術實力以及在創新能力上的先進性。
不管是惠及民生的預測仍是惠及企業的預測,這些預測能力的背後,都是百度強大的數據挖掘和人工智能算法。業內人士指出,如今,不少行業快速積累了大量的數據,但苦於沒有數據分析的技術,沒法看透數據中蘊藏的無限價值。百度智能分析技術的出現給了業界關於大數據挖掘的全新可能。
百度是一個大數據公司,有着很是大的數據量,這些信息最終產生了價值,而隨着互聯網的不斷髮展目前這些價值正在向鏈接人與服務的方向發展。將來,百度將持續大力投入發展智能分析技術,並但願開放數據處理能力,把數據思惟引入、滲透到傳統行業來促使產業升級。但願將來百度的大數據智能分析技術可以和行業深度融合,和傳統行業、互聯網同行一塊兒挖掘出大數據的價值,更好的把控將來。
A在現場聽到這麼多BAT的數據實力,實在是被震撼到了。從通常的報表分析到商業智能,從一臺機器到上千個集羣,從人工運營到機器學習智能運營,大數據在商業、金融、互聯網、醫療、民生等各個領域影響着人們的生活。會後A回家作了不少筆記和總結,感覺就是後面必定要多參加這些乾貨的分享會,可以瞭解到行業最前沿的信息。
也是從那以後,A完全迷戀上大數據,此次再也不是由於別人都在談論大數據,而是它真真切切地在改變人類的生活。天天會關注大數據行業的重要信息,關注36kr的大數據公司的融資信息,關注最新的技術。
-----------------2015.12.21更新-----------------------------------------------------------------------------------------------------
難忘的春節
年初,A回家過年,很開心,請了幾天年假外加春節的7天,算起來能夠休息大半個月了。相信每一個人回家過年的心情都是急切而又開心的,每一年就盼着這幾天能回家看看家鄉的發展變化。在中國,春節是家人團聚的日子,無論你是身處天南仍是地北,回家過年是一種召喚,也是一種責任。A回想起曾通過年的感受,那時候過年真有趣,家家都充滿了年味。和小夥伴一塊兒點燃五彩斑斕的煙花,此起彼伏的鞭炮聲烘托出濃濃的節日氣氛,還有各類各樣的春節晚會,歡歌陣陣迎新年。
而如今的除了串門吃飯,就是親戚間打牌,沒有了曾經的味道。大年三十那天,高速上堵成翔,也沒有阻擋A回家迫切的心情。大約開車開了6個小時,往常3個小時就回到家。老爸老媽都在家裏忙活着燒年夜飯和打掃衛生,老爸早上提着肉,紙錢和鞭炮去上廟、上墳。在墳前一排跪下,祖孫幾代都埋在這塊土裏,燒紙的飛灰在墳前飄起落下,A閉上眼,感覺着先祖的氣息,腦海深處的記憶,家族的血緣在身上流淌。
小時候姥爺指着這片空地說,這是個人,這是你爸的,這塊是你的,是的,那塊兩米見方的就是最終的歸宿,看着那塊雜草叢生的土地,有種恍如人生的錯覺,無論你的人生經歷了怎樣的風景,磨難也好,輝煌也好,終將在這裏止步,在這裏入土。
很小的時候,A比較任性有想法,不肯回家,在外面走南闖北,想努力拼鬥作出一番成績。那時根本不能理解爲何要回到出生的地方,也沒法理解何爲落葉歸根。就這一年,忽然理解了。
春節不是一個普普統統的日子,它已經被中國人賦予了更重要的意義。咱們懼怕失去,懼怕失去那些已經習慣的回憶,咱們厭煩,厭煩那些咱們沒法接受的老舊習俗。而人就是喜歡熱鬧的主兒,在歡笑、嬉鬧、開心中,咱們纔會記得更深入。
就在今年,A看到央視也在不斷播報着大數據的相關信息,在這團聚的日子裏,最熱門的出行方式還是火車,但與往年不一樣的是PC端拼車的關注度超過飛機,一躍上升到第二位。春節除了團圓,年貨的儲備也必不可少,今年除了常規服飾、酒水/飲料外,生鮮成爲新興熱門關注品類,位居關注度第三位。春節長假,外出旅遊深受一二線城市年輕人熱捧,與往年不一樣,今年的境外遊關注度遠遠超過國內遊,且春節旅遊搜索量移動端高出PC端總搜索量201%。
今年春節移動端搜索量總體大幅度超出PC端,七成用戶的手機搜索行爲比平時更多,春節網民在移動端的搜索行爲較平時更爲突出。春節期間人們習慣於在PC端進行計劃搜索,在移動端進行實時查詢搜索。以最熱門的火車票搜索爲例,網民在移動端進行列車信息查詢的行爲較多,而在PC端則是火車票購票以及關注購票網址。春節旅遊搜索行爲也一樣呈現該特徵,網民在PC端進行出行方式搜索,在移動端則進行酒店預訂搜索。
今年春節期間因爲火車票預售時間提早60天,總體拉長了春節週期,春節火車票搜索量相比去年上漲明顯。爲期40天的春運,搜索量總體比同期上漲240%,從春運PC端搜索關注度來看,搜索火車票預購佔總體春運的六成以上,而拼車搜索量首次超過飛機,關注度躍居第二位。針對火車票購買,從PC端網民購買火車票來看,最經常使用的仍爲官方網站12306網,其次爲去哪兒網、攜程網、同程旅遊網。今年新興的拼車出行,網友最愛上58同城、趕集網、百姓網等網站了解信息。而在本次春節遷徙大潮中,遷出人數最多的屬廣東省,其次是上海、北京、浙江、江蘇,其中一線城市包攬前三位。
春節前一個半月,春節旅遊搜索達到關注高峯,移動端高出PC端總搜索量201%。你們究竟要去哪兒?
今年春節網民對境外遊的熱情遠高於國內遊,境外遊熱門地點包括:日本、泰國、韓國,而國內遊首選地點爲:三亞、九寨溝、麗江。出遊人羣中,20-39歲的年輕人爲主要出遊人羣,且他們大部分來自一二線城市。出遊機票酒店預訂,網民也頗具共性,最受關注的旅遊網站攜程網、去哪兒、同程旅遊網三家已佔據超過80%的在線旅遊市場份額。
無年貨,不春節。中國人習慣於提早購買年貨,既爲一年一度的家庭大團圓作準備,同時也是接待親朋好友的必備佳品。2015年,在網友的年貨採購名單中,除了傳統服飾、飲料/酒水外,生鮮搜索量上升到第三位,便捷的物流加速了食品的流通,新年人們在品嚐家鄉美食之際,也能夠嚐到平時少見的新鮮外地食品。
今年春節期間分別出現了兩個年貨搜索高峯,第一個搜索高峯主要集中在購完車票後(1月18日-23日),第二個波峯出如今電商年貨促銷期間,主要集中在2月10日-2月16日(臘月二十二至臘月二十八),淘寶、京東、天貓成爲最受關注的電商年貨平臺。
提到春節熱點,就不得不提到紅包。今年收發紅包的形式再也不像往年通常僅僅侷限於當面贈與,而是經過多種渠道、多類平臺共同營造節日喜慶氛圍,微信、支付寶、手機QQ、微博等各大平臺,藉助春節紅包熱這一突破口大肆進擊,紅包發放範圍及數額均是驚人。
從農曆小年(2月11日)開始,紅包搜索就已日趨上升。在2月13日紅包搜索達到第一波峯值,2月18日除夕當天達到紅包指數最高峯值,其中關注度最高的紅包(由高到低)依次爲:微信紅包、支付寶紅包、手機QQ紅包。
除夕上午,騰訊地圖正式推出紅包地圖,並在央視新聞頻道亮相。從上午9點開始,央視新聞微信公衆號準備了2015萬現金紅包,除夕9小時,經過微信搖一搖,參與搶紅包。經過與央視新聞頻道合做,騰訊地圖利用其開放平臺的位置定位數據,真實描繪出一幅紅包地圖。
從第一次紅包搖過以後的不到一個小時,一幅生動的紅包地圖就出現了。上午這第一輪紅包,全國共有2200萬人次參與。看,以城市排名來看,果不其然,第一名是北京。
除了北京佔有絕對優點以外,以全省角度來看,廣東也搶佔鰲頭,浙江緊隨其後,其它地區佔比相對少一些。
這個結果,其實與中國不一樣的經濟發達程度基本相符。難道經濟愈加達的地區,人們越愛搶紅包?
北京、廣東和浙江人民,乃們是否是都不過除夕了,就盯着手機看了?
想更好地搶紅包?這三個地區的上空已經太堵了。
今年春節差點被大數據玩壞了,你們都是刷着手機搶着紅包。而在這背後,可以支持全國幾億人民同時打開手機搶紅包是大數據雲計算平臺的支持。而百度遷徙圖也是在時刻監控着全國的遷入遷出流量圖,選擇旅行的能夠參考客流量選擇錯峯出行。
今年春節差點被大數據玩壞了,你們都是刷着手機搶着紅包。而在這背後,可以支持全國幾億人民同時打開手機搶紅包是大數據雲計算平臺的支持。而百度遷徙圖也是在時刻監控着全國的遷入遷出流量圖,選擇旅行的能夠參考客流量選擇錯峯出行。
大年初四,按照年前的計劃,與同窗一塊兒去雲南旅行。彩雲之南,雲南是個很美的地方,可是因爲如今不少旅客的到達,打擾了那份寧靜。從昆明、大理、麗江到香格里拉,A感覺到區別於華東沿海江南水鄉的另外一番西南風光。這裏有雲南米線、有耀眼的太陽光線、有淳樸的人民、有美到使人窒息的洱海、也有那一晚上成名的豔遇麗江、高處不勝寒的玉龍雪山、他國風光的香格里拉。在這裏沒有工做的壓力,沒有生活的繁重,沒有嘈嘈雜雜的汽車聲,像是來到了鄉下。這裏的山,雲夢縈繞;這裏的水,滿江春意;這裏的花,爭相競豔;這裏的人,淳樸善良。千年歷史,多民族多文化交融,造成了獨特彩雲之南。雲南,素以其美麗、豐饒、神奇而著稱於世,一貫被外界稱爲「祕境」,吸引着世界各地的遊客。聞名於世的金沙江、怒江、瀾滄江幾乎並排地經這裏流向遠方,險峯峽谷縱橫交錯,江河溪流源遠流長,湖泊溫泉星羅棋佈,造就了這塊神奇美麗的樂土。 從世界園藝博覽會舉辦地的省城昆明,到「風花雪月」的大理名勝;從高原水城麗江、神奇的「香格里拉」—中甸,到孔雀曼舞的西雙版納;從「天下第一奇觀」的石林、千姿百態的元謀土林,到世所罕見的「三江」並流,江狹水兇的虎跳峽……這些迥然相異的山川景色,如一個自然的天然博物館,每一位來到這裏的遊客,都會深深地感覺到這是一塊博大而充滿激情、深邃而富有魅力的神奇之地。
由於路途不像平原那樣的大寬平整的馬路,A沒有選擇自駕,而是坐大巴和火車的方式,不過這一路上也比較艱苦,沒有空調的大巴和遍地都是箱包的綠皮火車,不過能看到沿途的美景也是值了。
-----------------2016.1.7更新-----------------------------------------------------------------------------------------------------
「她」的到來
快樂的時光老是短暫的,一眨眼的功夫已經來到了上班的工做日。年頭一來整個團隊就是在忙着規劃這年要幹嗎幹嗎。團隊leader和像A同樣的數據工做者們,像一羣緊密協做的工蟻們,從各自的想法角度去提本身想作什麼樣的項目。有計劃要作機器學習的可視化平臺的,有想作金融大數據分析的,也有想作行業指數預測的。
在A看來,這些均可能是今年或者之後大數據這塊會流行的發展方向。
好比機器學習的可視化這塊,微軟就推出了一款azure ML的產品,經過這一平臺,客戶能夠利用雲計算技術開發基於大數據的應用和應用程序接口(API),預測將來事件,而不只僅是分析以往已發生的事件。
這款產品基於微軟一些現有產品,例如Xbox和必應的機器學習功能,並提供了預約義的模板和工做流。相對於傳統開發手段,這將幫助客戶更快地開發出預測應用。此外,客戶還能夠在Azure ML平臺之上發佈API和網絡服務。
負責Azure ML的微軟企業副總裁約瑟夫·希羅什(Joseph Sirosh)表示,這一平臺幫助微軟的客戶和合做夥伴開發大數據應用,能預測並改變將來的結果。希羅什此前曾供職於亞馬遜多年時間。
他表示,前瞻性能力是這款產品的一大特色。
「傳統數據分析幫助你預測將來,而機器學習幫助你改變將來。」希羅什表示。他表示,經過支持模式識別,你能夠預測需求、疾病的爆發,電梯什麼時候須要維修,甚至預防犯罪。
希羅什表示,因爲帶來了規模效應,雲計算將改變行業發展。此外,雲計算帶來了強大的計算性能,而若是企業試圖自主建設數據中心,那麼須要花費幾周甚至幾個月時間。
「雲計算解決了最後一英里的問題。」希羅什表示。在此類服務出現以前,你須要數據科學家肯定數據集合,隨後讓IT部門開發應用,提供支持。在工程上以較大的規模完成最後一步每每須要幾周或幾個月時間。而Auzre ML簡化了這一流程,提供一種方式,使開發者在幾小時內就能開發出一樣的應用。
此外,Azure ML支持開源項目Project R的300多個包,而這一開源項目目前被許多數據科學家使用。
希羅什表示,微軟但願,隨着愈來愈多用戶使用這一平臺開發API和應用,平臺上將造成「數據和API之間的良性循環」。他表示:「人們擁有數據,並攜帶數據在Azure ML上開發API。人們鏈接至應用,隨後向雲計算平臺反饋數據,從而推進更多API的開發。」
Azure ML微軟已提到了多個例子,其中包括Max 451。Max 451是微軟的一家合做夥伴。該公司與大型零售商合做,預測哪些商品最有可能被消費者購買,並在需求出現以前確保庫存充足。
卡耐基梅隆大學目前與Auzre ML合做,試圖下降校園建築的能耗。該學校嘗試預測及減小活動,從而下降總體的能耗和成本。
微軟並非涉足這一領域的惟一一家公司。IBM去年冬季將超級計算機「沃森」做爲一款雲計算服務推出,提供了相似的機器學習應用開發功能。上週,一家名爲Ersatz Labs的創業公司也推出了深度學習人工智能雲計算平臺。
最終團隊商量決定作機器學習的壞帳率控制這塊,主要出於考慮在資金體量如此龐大的集團,若是可以下降1%的壞帳率,能夠給整個公司帶來巨大的價值。而眼看着團隊也就10我的,並且都是在作算法應用這塊的,嚴重缺少相應的開發和前端。
團隊leader開始四處招人,拉資源。花了一個月的時間,相應的資源方都聊過以後,以爲仍是能夠作不少東西的,就都開始緊鑼密鼓準備開始開幹。這麼些天,PM在考慮着總體的業務框架,PD在想着作成什麼樣的產品模型,算法工程師想着須要哪些數據和特徵,數倉配合進行數據的蒐集和清洗。
這天,開發團隊來了一個新同窗J,A在看到她的第一眼,心裏有些觸動。感受J是個很特別的女孩。而A也沒有想到,就是這樣一個看起來還不錯的女孩,在之後的工做和生活裏影響了A的一輩子。成爲了彼此心目中的soulmate。
未完待續。。。
-------------------------------------------------------------------------------