專欄介紹前端
「對話 CTO」是極客公園的一檔最新專欄,以技術人的視角聊聊研發管理者的發展和成長。程序員
本專欄由ONES 的創始人&CEO 王穎奇做爲特邀訪談者。王穎奇曾參與金山軟件 WPS、金山毒霸等大型軟件的核心開發工做;2011 年創立了正點科技,旗下產品正點鬧鐘、正點日曆在全球用戶過億;2014 年,王穎奇在知名美圓基金晨興資本任 EIR,並以我的身份參與十餘家公司的管理諮詢工做;2015 年,王穎奇創立 ONES,致力於提供企業級研發管理解決方案。算法
摘要數據庫
創立之初,GrowingIO 以無埋點技術切入市場。爲了讓數據平臺能夠幫助客戶作深度的用戶轉化、留存分析,GrowingIO 花了三年多時間去打磨產品。後端
正如 GrowingIO 聯合創始人&CTO 葉玎玎所說,真正去作一個 SDK 來採數據其實很容易,可是要作 SaaS 服務,要針對不一樣用戶的不一樣寫法去作通用型的開發,還要考慮應用開發自己的一些易變化特性等等,這些都須要很強的技術支持。瀏覽器
葉玎玎曾在網易杭州研究院從事工程數據庫相關工做,2009 年接觸 SaaS,2015 年到 GrowingIO 負責核心產品研發。機器學習
本期對話 CTO,咱們請到了 GrowingIO 聯合創始人&CTO 葉玎玎。關於 GrowingIO 產品如何支持業務發展,以及數據分析產品的歷史演進,葉玎玎談了談本身的見解。工具
產品作給業務端學習
穎奇:很高興 GrowingIO 的 CTO 葉玎玎同窗能接受咱們的訪談,我以爲能夠先大概講一下 GrowingIO 在技術方面的一些特長。大數據
葉玎玎:OK,若是要研究 GrowingIO 的技術,必定要先了解它的形態。GrowingIO 是一家雲的公司,作 SaaS 的公司,因此咱們全部的客戶數據的採集都會在雲上。
目前咱們第一個技術特色就是外界所熟知的無埋點,自動去採集用戶從打開應用或者打開網站到離開的全部行爲數據,這個行爲數據經過可視化的定義方式去展示。其實這會涉及到你如何去理解客戶端的實現,不管是對瀏覽器自己的實現,仍是對於 iOS 或者安卓操做系統的實現,這裏都須要不少黑科技的東西。去了解它的實現後才能更好地在上層去研究怎麼作無埋點的邏輯。因此這個是咱們在過去三年花了不少時間去研究的東西。
真正去作一個 SDK 來採這些數據其實很容易,可是要作 SaaS 服務,如何針對不一樣用戶的不一樣寫法去作這個通用型的開發,而且是插件,包括這裏面還要考慮如何去應對應用開發自己的一些易變化特性等等,這裏須要作不少東西。
因此咱們在這個過程當中本身也用了不少方法,經過算法、模型、機器學習等方式,考慮怎麼去讓前端採集到的數據跟後端用戶的數據邏輯之間更好的匹配,因此這個就是外界所熟知的 GrowingIO 的無埋點。但本質上另一個挑戰在於,當有這麼大數據量進來的時候,我怎麼去處理數據?我相信 GrowingIO 數據量在國內應該算蠻大的。
穎奇:由於無埋點自己是沒有篩選的來進行數據採集,因此確定會有很大的數據量。
葉玎玎:一方面是這個,另一方面也在咱們數據系統自己。舉個例子,咱們天天可能有個兩三千億條的消息,我相信大部分公司都達不到這個量,這是第一點。第二點是,GrowingIO 有一些幾個億 DAU 的客戶,單體客戶幾個億,再加上雲端有這麼多其餘的客戶,怎麼更好地處理、存儲、查詢,都是一個很大的挑戰。
穎奇:那對比市場其餘競品,在數據量這方面,GrowingIO 有沒有一些技術上的先進性?
葉玎玎:是有的。 GrowingIO 目前有一個不少客戶認爲很方便的功能——指標維度的多維交叉,實現任意去拖拽指標維度,瞬間出圖。舉個例子,你要進行基於人的指標維度任意交叉的時候,GrowingIO 是能夠快速出結果的。具有這些屬性的用戶,而後作過哪些事情的用戶,在歷史上的任何一個時間點,能馬上知道這羣人,馬上計算出來他們有誰。這個東西在以前的數據系統裏面相對來講是比較少的。大部分數據系統,不管是 T+1 仍是實時,仍是一個小時這種,它都是基於事件的處理。
穎奇:這就是說分析過程上大家應該是作了更多事情的。
葉玎玎:我以爲是在用戶畫像自己,就是咱們如何去更好的找到一批用戶。而後這個過程包括,若是你找一個其餘的用戶分析系統,你想要看留存,或者說要去作轉化路徑,要找到哪些優化點,那核心其實就在於對於用戶之間羣體的對比。
對單一人羣去作分析其實很容易,可是一旦要將用戶之間對比各類東西,而後又要達到很是快的響應效果,這個實際上是其餘競品很難作到的。這裏最核心的差異是說,由於咱們一直是作給業務端的,就是產品運營等等,因此咱們的要求就是他們能很是簡單的從咱們的分析工具裏面去獲得結果。
穎奇:因此 GrowingIO 在無埋點等技術上有哪些關鍵特色呢?
葉玎玎:無埋點確定是咱們一個關鍵特色,由於使用其餘產品的話,你可能須要本身去梳理全部東西,咱們是讓那個業務直接能夠本身去作。而後第二點是基於這個能力上來講,自己咱們會演變出來新的一層能力,咱們能快速作實驗。好比我如今想要一個東西,這個時候我不是找研發去幫我作打點,而是直接能夠看到結果。我當時本身爲何以爲 GrowingIO 很值得作,就是由於我以前用其餘數據分析工具時,陷入到數據採集-使用、採集-使用的整個不停的輪迴之中,這個過程當中,大量時間其實被浪費在前端的採集和處理這一塊,真正進入到核心的產品邏輯的迭代和產品的改進的時間是比較少的,而 GrowingIO 就不會有這樣的問題。
高效能遠程工做
穎奇:我瞭解到您以前是有作過遠程團隊的工做,您以爲遠程工做這樣的方法在中國如今是否是真正可以去很好的來實行?
葉玎玎:我我的判斷相對是比較難的,它必須變成兩種模式。遠程工做要麼就是全員遠程,這個事情反而是能夠作的。由於全員遠程意味着你們每一個人都接受了,我必需要爲了咱們的效率提升付出額外的努力,而後爲了下降個人溝通成本,我要作哪些事情。我以爲這個是很是關鍵的。但這裏面若是存在大部分人不遠程,某一兩我的、兩三我的遠程的狀況的話,這個就會變得很是尷尬。由於不少時候最高效的溝通確定是面對面溝通,而後在面對面溝經過程中,有一我的若是在遠程的話,那不少時候他其實不知道其餘人在聊什麼,由於除了語音、視頻之外,還有一些肢體語言等等,而後聊着聊着很容易的一點就是你們把遠程的人忽略掉了。
因此我我的的建議是若是全員遠程,這個是 OK 的。可是這種模式是否能演變出來很是快地去響應變化,這是有一些潛在風險的。因此這個意味着整個團隊的認知須要達到必定的高度,而後整個團隊爲了達到更高的效率,更好的溝通,願意付出什麼。若是你去評估這兩點以後,以爲這是本身可承受的風險,那能夠選擇。若是對一個創業公司的話,我以爲這個多是比較難的。可是若是對於一些看着需求作事的公司來說多是沒有任何問題的,由於這個過程當中無非是我怎麼把項目管理作的更好。或者還有不少公司選擇了另一種模式,其實不算遠程,就是一個多地的辦公室。
穎奇:前一兩年的時候,由於一些效率工具的出現,你們都說可能將來是遠程工做的時代,人會愈來愈依賴工具。可是如今咱們愈來愈以爲,真正工具剛需的來源不是由於遠程工做,面對面的時候咱們也是須要工具的。
葉玎玎:我以爲工具的核心不是爲了解決遠程的問題,而是人是在流動的,是不必定都在一塊兒的。好比風車到最後服務的團隊多是在一個 office,可是由於你們都出去了,因此在這個過程當中怎麼去分配工做,怎麼去溝通等等,(工具自己)仍是解決相似這類問題。
圍繞用戶作分析
穎奇:您怎麼看待中國數據分析行業的過去、如今、將來?包括過去一代二代的數據分析產品,如今的數據產品,能夠來分享一下您的見解。
葉玎玎:我以爲最先的應該不叫分析工具,叫統計工具。像 CNZZ 也好,像百度統計也好,作流量的一些統計,核心是在流量層面。
而後再往下,你們會說光是統計還不行,要進入分析,要了解一下個人用戶整個狀況是怎樣的,那這個時候會演變出來第二代的數據分析產品,就是基於事件的。由於每一個事件都會對應到人,既有事件的模型又有用戶的模型,這個用戶到底作了哪些事情,而後去篩選用戶,這個是第二個階段。
目前大部分的工具應該也在這一層,包括在 2010 年左右出來的友盟、Talking Data 爲表明的一系列工具,當時它們承載的不少可能就是流量統計的功能,可是它們也有事件模型。而後再到下一代,從事件自己到開始運營用戶的生命週期了,就是到用戶這一層。
穎奇:到用戶這一層了,就是會把它組合起來看。
葉玎玎:是的,我經過事件去更具體的去看一個用戶,核心圍繞着用戶來作分析,不是核心圍繞着事件來分析。因此咱們全部的人的模型在整個數據分析裏面就會成爲第一個關注點,這個是很重要的。而後再往下的東西也跟這個時代相關,由於如今有不少機器學習,你要去作個性化,這個過程當中,你怎麼去更好的基於機器學習來作東西,不管是從各類推薦引擎,或者說各類的計算模型,這樣演變出來好比作 alert(提醒)、anomaly detection(異常檢測),那這些又會進入到下一個階段。可是這裏的全部都是基於你的數據層是乾淨的。數據這一層要有一個好的基礎,否則想着跳到下面步驟的話是很難的。
穎奇:在您剛纔講的用戶精準個性化的一些業務上,咱們如今看到的這些數據平臺更可能是幫忙分析,大家會有一天可以真正走到業務中去嗎?好比說可能會提供一些數據的接口,或者提供一些很是精準的畫像,每個客戶最終都會跟真正業務端的服務對應起來。
葉玎玎:其實咱們如今就在作了,我剛纔提到,理論上咱們的客戶主要打的仍是業務端,好比產品、運營,他們用咱們系統就在作這件事情,真正走到業務裏面去,他們在咱們系統上去定義各類東西。舉個例子,咱們可讓系統找出來,好比昨天註冊了,看了 Demo,可是沒有繼續去作建立項目的人。這羣用戶篩出來之後,針對這些用戶能夠去作觸達。而後好比在作哪些事情的過程當中,你到底要給他一個什麼樣的動做,這些東西是咱們在幫咱們客戶作的,因此它實際上是很是業務化的。
穎奇:可否給你們介紹下您的我的職業經歷?
葉玎玎:我以前在網易杭州研究院工程數據庫相關的組裏面工做了一年半,2015 年以後在作 GrowingIO。中間有幾個節點,第一個是我最先遠程是 Freelancer,那時候更可能是幫美國的一些創業者去作 0 到 1。而後 09 年到 12 年,我從本身研發的這個點更加往外擴出去,負責產品研發,作企業社交這一塊。可是我是從 09 年開始真正去接觸 SaaS 這個行業,而後接觸 to B 這個方向。
09 年的時候,咱們很是看重怎麼去作實時 Web,由於它在 09 年的時候其實沒有太好的解決方案,但那個時候咱們爲了本身作的東西,就作了不少技術上的突破。而後到作協做工具也是,就是怎麼把用戶體驗和當時實施的技術更好的打包成一個方案表給到用戶。而後到 14 年末開始作無埋點,也是在當時很是新的一個東西。
12 年末到 13 年又作了另一個蠻好玩的事情,就是 Teahour,一個技術播客。我以爲當時 Teahour 對不少剛工做一兩年的或者在剛畢業要找工做的那羣人給了不少方向性的指導。
穎奇:您以前一直在作程序員,也一直在作本身的項目,那最終變成一個這麼大公司的 CTO,中間有什麼特別重要的一些轉變,或者您以爲比較關鍵的時間點或者里程碑,經歷了以後就變成一個 CTO 了。
葉玎玎:由於我從 06 年畢業的時候就開始創業,無非是一開始創業相對來講團隊的人數可能比較少,而後會經歷一個團隊從小變大的過程。我會很是關心用戶究竟是怎麼想的,對我來講,爲何我對數據分析很感興趣的一點,在於我會嘗試經過這個去理解到底用戶在用個人產品的時候他內心的想法。因此我以爲很核心一點是,我本身是在思考到底這個業務和產品應該怎麼來作的,因此我以爲我跟大部分的技術不太同樣,我會很容易在用這樣的視角去思考。
穎奇:很是棒。最後可不能夠推薦一些您最近看的認爲比較好的書給你們。
葉玎玎:我看的書會比較更加偏意識形態一點,更加偏管理一點。我最近一直在看《賦能》,《賦能》這本書核心講在如今這個時代,你到底應該有什麼心態,應該怎麼去更好的發展等等。
穎奇:好的,今天有不少收穫,很是感謝。
想要更好更快地發佈產品?請掃描二維碼,或訪問http://ones.ai 瞭解更多。