「工具人」 趙生宇:清北本碩,爲開源從阿里辭職去同濟讀博

趙生宇眼中的開源,是一種開放式組織形式,是對現有生產關係的變革。當他說要作開源時,不只是寫代碼,還包括探討這種新的組織形式的理論意義、治理框架、社區維護、運營工具等等,就像不少人看到的那樣:開源是個筐,什麼都往裏裝。前端

2013 年,趙生宇攝於騎行路上。
 

33 歲的趙生宇正在同濟大學計算機系讀博士二年級,專門研究開源,擅長製做開源治理自動化工具。程序員

清華計算機系本科,北大軟件開發碩士,他曾經覺得本身會作一生的程序員,但面對開源社區的邀請,他兩度辭掉手頭的程序員工做去作開源運營。當他在阿里發揮編程優點改造傳統運營方式而且風生水起之時,再次辭職,一頭扎進學校,只爲尋找開源的答案。算法

身邊的人,有時甚至他本身都會不解一路走來的選擇。可是,逐漸地,他在開源的道路中知道了本身真正想要的是什麼。編程

「在開源世界中的探索給人一種自由的感受。」這纔是趙生宇一直追求和嚮往的,對他來講,遨遊在開源世界的感受就好像他在 2013 年獨自騎行一個多月橫跨大半中國同樣,彌足珍貴,「如今做爲學生自由地探索開源和當時騎行的感受也很是相似,很累,比較孤獨,但很是自由,是一種追夢的感受。」微信

從西寧市至北京市,趙生宇 2013 年騎行路線圖。

在寫代碼與作開源之間橫跳

「我一直以爲,我是一個技術背景的人,應該作一生的研發或程序員,但同時我又始終被開源吸引,因此就會在不一樣崗位之間反覆跳。直到找到一個很是好的結合點,把我興趣和技能結合起來。」網絡

2015 年,Apache 基金會聯合開源社籌辦 Apache Roadshow 2015 China 活動。還在讀研的趙生宇經同窗推薦,以學生志願者身份參會,給任 ASF 副總裁的 Niclas Hedhman 作隨身翻譯。會上來自 ASF 的成員講述了 Apache way,開源治理,大數據生態體系等等。在閉門圓桌會議上,技術界的衆多大咖齊聚,暢談技術發展歷史與趨勢,這給了他很大的衝擊。架構

Apache Roadshow 2015 China 閉門圓桌會議,趙生宇以學生志願者身份參與會議記錄,圖中有 Apache VP Niclas Hedhman、微軟計算機科學家,Delphi、C#、TypeScript 之父 Anders Hejlsberg、Apache ServiceComb 負責人姜寧、Apache Kylin 負責人韓卿等。
 

由於做爲會議志願者表現優秀,大會組委會成員陳陽給了趙生宇一個到微軟作社區運營的實習機會當時拿了校招 Offer、並已經在美團開始數據治理工程師崗位實習的趙生宇辭職去作了一名運營:框架

「那是很是大的一個轉折點,可是當時我對開源的認識仍是很是模糊的,就知道開源是頗有意思的一件事情,頗有趣的一羣人在作一些看起來很是有愛的事情,並且有機會和技術界的大咖面對面的交流。」工具

畢業以後,趙生宇找了一份「老本行」工做,在網易遊戲作一名研發工程師。任職網易期間,他一直沒有間斷參與開源社區的活動,或多或少都會出些力,好比作志願者招募,協調場地,會務處理等等。學習

有一次,他專門請假從杭州去上海,協助開源年會的舉辦。老闆問他幫忙是否是有錢拿,他說不是,你們都很不解。 

「具體爲何我本身也不太清楚。」直到如今,趙生宇依舊不太理解本身當時的動機,只是用「感受很是好」來形容,「你們會以爲你是一個志願者,很是有個性地把這件事組織好了,那你們就很是認同,給你豎個大拇指,你就會很開心。」

慢慢地,經過這些活動趙生宇認識了更多開源圈子裏的人。2018 年,阿里邀請他去作開源運營。幾乎沒什麼猶豫,他就答應了。也正是個第二次從事開源運營的經歷,讓他找到了本身的技能和開源的結合點。

結合點

結合點就是開放式組織的數字化治理,用數字化工具讓開源運營更簡單。

入職阿里兩個月時,趙生宇接到任務,去採訪他們運營的某個開源項目的 contributor(貢獻者),和每一個人深刻交流。工做第一步就是獲取每一個 contributor 的聯繫方式。因爲 contributor 都是 GitHub 上的代碼提交者,想找到他們能夠去看代碼提交時的關聯郵箱,或者看我的主頁是否留下聯繫方式。傳統運營此時的作法大機率是維護一個列表,找到每一個人的信息,實時更新表格。

「我是學計算機的,因此立馬想到能夠寫一個腳本自動獲取這些信息。」趙生宇的技術背景優點在此刻凸顯。

緊接着,他發現 GitHub 自己開放了大量數據,能夠作各類數據的持續採集和分析。完成以後,他意識到這件事很是有價值,能夠大幅度下降傳統運營的人力成本,實現自動化。因而向公司提出想要轉變本身的工做方式,「我不但願作傳統運營的那些事情,我但願作和數字化相關的事情,好比作軟件工具,從 GitHub 上爬取數據,分析數據,進而支撐傳統運營的工做。」 

這種想法進一步實現的是 2018 年,阿里想要對外發聲,須要評估阿里在全球開源生態中扮演什麼角色,怎麼定義貢獻之類。公司談論開源貢獻每每能夠很容易列舉出共開源了多少項目、項目有多少個 star,在全球有多少貢獻者,爲開源開發投入多少資金等指標,但很難評估出公司在全球開源生態中的地位。上述這些可見指標中也或多或少與實際狀況有誤差,好比 star 能夠刷,開源項目的多少並不表明質量等等。而此次任務就引出了趙生宇如今還一直在作的事情——GitHub 全域數據分析

2019 年 Linux Foundation 主辦的 Open Source Summit 上海站,趙生宇表明阿里巴巴介紹數字化運營方面的工做進展,其中就包含對於 2018 年整年 GitHub 數據的全域分析的初步結果。
 

「長遠來說,若是能夠實時分析很是活躍的開發在不一樣項目之間遷移的過程,其實能洞察整個技術世界的發展趨勢,這件事對公司的技術戰略很是有幫助。」趙生宇擅長大數據處理,利用他擅長的技術洞悉開源的發展規律恰好是結合了興趣與我的技能。

去年,趙生宇還以同濟大學與華東師範大學聯合主辦的 X-lab 開源實驗室成員的身份,正式發佈了他基於 GitHub 全域日誌的圖數據分析成果 OpenGalaxy 2019——開源星系 2019,介紹了一種基於開發者協做網絡的全域項目影響力評估與項目聚類算法。開源星系 2019 是目前已知全球第一張也是惟一一張 GitHub 全域項目全景圖,包含 2019 年 GitHub 全域 17 萬個較活躍項目的影響力和聚類結果。

2020 年,他也在 X-lab 實驗室的 GitHub 組織下開源了 GitHub 數字分析的項目,將全域數據分析的能力集成到 GitHub CI 中,使更多人能夠一塊兒參與到全域數字分析的協做中。X-lab 也將在 2 月份發佈《GitHub 2020 數據洞察報告》,更全面的展現他們在 GitHub 全域數據分析上的成果與進展。

OpenGalaxy 2019,展現了 GitHub 上 2019 年最具影響力的 17 萬個項目的全景圖,節點的大小表示了項目的影響力,而不一樣的顏色則表示了項目所屬的領域。
 

GitHub 全域數據分析是趙生宇爲本身找到的,我的技能與興趣之間,即寫代碼和作開源之間的結合點。

而在阿里接近兩年的工做經驗,也讓他對開源自己有了更多猜測。

帶着問題回學校

剛加入阿里時,趙生宇所在團隊僅僅是負責一個項目的運營,以後團隊迅速擴大,成爲阿里開源辦公室,開始統籌阿里集團的開源工做。

期間,他作過活動、內容、數字化運營、開發、訪談、報告,甚至是績效評估、風險管理等等。也真正從企業內部認識了開源,從運營和治理的角度看開源,開源在他眼裏再也不僅僅是一羣有熱情的人彙集在一塊兒作一些看起來沒有收益的事情,而是要立足企業治理,從公司戰略層面去思考和行動。

換個角度看開源,新的問題出現了:開源治理的框架應該是什麼?應該用什麼樣的角度去看待開源?在不一樣的角度上應該用什麼方法去解決什麼樣的問題,達到什麼樣的效果?

搞清楚這些尚未多少人探究過的問題最好的地方就是學校。」對開源的強烈求知心驅使趙生宇從新規劃人生路徑,他決定換個環境去思考。

說來也巧。趙生宇曾在一次開源社區活動上認識了他後來博士生導師之一王偉,幾番交流以後二人日漸熟悉起來。2019 年 5 月,王偉給趙生宇發消息,說本身恰好有一個博士的位置,和開源相關,問趙生宇是否有意願。

趙生宇很是心動,果斷表示:「我來。」

2019 年 9 月,趙生宇從阿里離職進入同濟。回到學校的他有了更多的時間作研究,開始學習管理學、經濟學等人文學科知識,在跨學科背景下看開源。因爲他本碩都是讀的計算機系,高校研究制度不容許無跨學科背景的人作跨學科視角研究,因而,趙生宇就開了課題「從全域數據中挖掘協做模式」,大的興趣方向是跨學科視角下的開源理論研究和開源項目工具開發。

至此,趙生宇的開源探索有了一個大體的框架。

他堅信開源做爲一種開放式組織形式,能夠變革人類社會現有的這種生產方式,尤爲是公司。

而從組織形式的角度看開源,開源就須要一整套的治理框架。同時,基於此框架的數字化、自動化的治理工具也能幫助開源項目及社區更高效的運做和管理

猜測印證

2020 年年初的一個項目,讓趙生宇進一步肯定了兩件事:一是開源能夠是領域生產關係的變革,而不只僅是軟件開發;二是開發自動化協做工具的可能性與重要性。

2020 年 1 月 23 日,除夕夜前兩天,武漢因新冠疫情封城。忽然的災難打破整個社會的陣腳,和大多數人同樣,趙生宇的所見被來自醫院、醫生、病人等各方的求助填滿,「就是在除夕當晚,我記得很是清楚,大概從八九點開始,朋友圈、微博、微信羣很是多這樣的信息,你們都在轉,我內心也很是不舒服。」

然而此時的趙生宇滿心焦灼卻沒法施以援手,許多可信的捐款平臺資金池已滿;一些求助信息以圖片形式傳播,長串的銀行帳號在圖片中傳播難以使用,用他的話來講就是:想捐個款都太難了。

除夕夜當晚,趙生宇難以入睡,「做爲計算機系的人,那段時間也一直在作數據相關的事情,看到這些就有直覺,想是否能夠作一個數據平臺解決問題……」

想到凌晨三點,他決定啓動一個數據平臺項目,便動筆寫倡議書,由於明白工做量的浩大,打算用開源的方式號召更多人加入。次日一大早,他將倡議書發給實驗室導師,同時也是開源社執行長的王偉,做爲武漢人的王偉老師很是支持,中午時就經過 X-lab 實驗室公衆號發出。

Wuhan2020 項目啓動了。

Wuhan2020 的定位是武漢新型冠狀病毒防疫開源信息收集平臺,須要收集的具體信息包括醫院、酒店、物流、生產、捐款、預防與治療、義診、動態。最初的設計是參與者能夠到 GitHub 上提交 csv 格式文件並存儲,以便前端獲取結構化數據。

很快,趙生宇發現,GitHub 本質是一個代碼協做平臺,提交表格類數據很是困難;另外國內許多程序員對 Git、GitHub 並非很熟悉,所以協做效率不高。次日,趙生宇和實驗室的同窗去調研在線協做表格工具,最終選定石墨表格。

石墨表格是一家武漢科技公司的產品,得知 Wuhan2020 項目有意使用石墨表格以後,石墨的一些工做人員以我的身份參與進來,幫助對接了部分信息採集的團隊,有收集新聞事件的團隊,也有作疫情防控知識文檔協做的團隊……

解決了信息採集的問題,接下來是數據的加工、處理、可視化。

趙生宇和石墨產品的開發者配合,寫了一個鏈接石墨和 GitHub 的自動化工具,將石墨做爲信息的採集端,GitHub 做爲代碼採集端,中間經過自動化程序連通。每隔兩個小時從石墨表格裏採集數據,過濾掉未審覈的數據,而後校驗每一列,檢查出格式不匹配的數據後上報錯誤;沒有問題的數據裏,抽取出聯繫人電話號碼、帳號、地址信息等數據並進行自動化二次加工,打包成數據包上傳到 GitHub 的數據倉庫,轉化成開放的數據,這時你們就能夠直接拿開放數據作應用。

愈來愈多貢獻者涌入項目,最終 Wuhan2020 在半個月內完成開發,參與者多達四千多人。

Wuhan2020 有三個項目在同一天內登上 GitHub Trending 榜全球 Top 5
 

一個德國開發者基於 Wuhan2020 作了款手機 APP,直接讀取 Wuhan2020 的數據顯示在手機上。

美國醫療公司 Button 用數據作了面向海外的網站,促成一筆武漢醫院從歐洲採購了上百萬美圓醫療物資的交易,也有美國人經過這個網站捐助口罩等物資。

社區的志願者自組織爲 Wuhan2020 項目作了官方網站,展現貢獻者、項目、社區等等。

經過來自社交網絡的反饋,趙生宇也知道有不少人經過這個項目,一鍵複製銀行帳號,完成捐款。

……

「若是說 Wuhan2020 解決了多大的問題,我以爲並非。」對於 Wuhan2020 項目取得的成績,趙生宇並非很是滿意,他認爲首先 Wuhan2020 沒有打通全鏈路,如捐款、捐物等;其次,美國醫療公司 Button 是個例,具體多少人使用 Wuhan2020 並不能追蹤,所以沒法準確評估價值;此外 Wuhan2020 發佈時間特殊,「項目自己有一個很重要的前提條件,它發生在那個時間節點,不少因素都很是巧合的碰到一塊兒,這個項目纔會產生。」

Wuhan2020 對趙生宇來講更重要的結果是印證了以前的一些猜測。

一是 Wuhan2020 探索了開放式的組織形式,證實開源能夠是對各領域生產關係的變革。趙生宇認爲,Wuhan2020 區別傳統意義上的技術開源,是一個非典型的開源項目,研發僅是一小部分,參與者有許多都是非開發者,好比貢獻數據的學生團隊、設計團隊、宣傳團隊、運營團隊等,並且他們也與上游的工具廠商有緊密的鏈接,「當時 Slack、Figma、石墨、句子互動也都給了咱們商業版免費支持」。

而且它印證了開源這件事不只和軟件相關,更是對整個組織甚至跨組織管理的變革,對人的生產關係的變革。生產關係的變革是指不一樣領域的人們能夠在沒有簽定勞務合同,沒有過多外力強制的前提下,出於共同的願景和目標去從事生產。

二是 Wuhan2020 證實了開發自動化協做工具的可行性和重要性。Wuhan2020 項目是來自各地、各領域的貢獻者用多個協做工具創做,並經過自動化工具鏈接的:數據收集志願者用石墨表格協做數據有北美設計師用在線協同設計平臺 Figma 作 UI 設計協做;開發者在 GitHub 進行代碼協做;而他們也本身開發了工具用於跨平臺的數據同步與權限管理。基於這些協做平臺與自動化工具,全部人才有可能構成一個完整的協做組織。

開源對人意味着什麼?

「站在幾十年後、一個世紀之後回望的時候,開源對於人類到底意味着什麼?」

Wuhan2020 激發了趙生宇更多思考,以後的 2020 年,他更多地去讀跨學科的書籍,尤爲是經濟學、管理學、社會學:

我但願創建起一個框架去剖析開源,並使開源模式能夠更好的發展和推廣

對這個目標,趙生宇還沒能給出一個確切、甚或是大概的答案,但他已經經過不一樣學科理論更理解開源。目前最讓他受益匪淺的兩個學科是新制度經濟學與管理學。

其中新制度經濟學強調從制度成本的角度去分析組織的有效性,制度成本理論讓他意識到開源社區的有效性在於「不能提升效率就終會消亡」。

若是組織管理和研發管理的問題較多,生產成本較大,就註定會走向消亡,不管在開源仍是傳統企業中都是如此。開源雖然在組織邊界有限開放的狀況下在某種程度上下降了產品獲客和技術品牌建設與宣傳的成本,但與此同時開放式的協做帶來的挑戰更多。

雖然如今不少人都認同「一個項目是否定真作開源,看 CI 就知道了」的說法但趙生宇認爲將來的自動化手段將不只 CI 系統。CI 僅僅解決了大規模協做中的測試與信任成本高的問題,將來的自動化工具同時還須要關注組織的成員架構管理、權限管理、研發流程管理、績效評價、社區運營等一系列與開源相關的生產環節,而每一個環節的自動化都是對制度成本的下降,從而增長組織的有效性,使社區能夠更加平滑的運做。這也從理論層面加深了他對自動化工具重要性的認識。

另外,新制度經濟學打破了新古典經濟學中的「徹底理性人」假設,將「有限理性」做爲一個基本假設這使得趙生宇能夠跳出純理性的收益分析來看待參與開源。

不一樣學派對於有限理性根源的探究,爲趙生宇理解開發者行爲和探究開發者運營策略時提供了諸多耳目一新的角度

管理學中關於「情緒對生產力影響的研究也印證了這個觀點,社區中開發者的歸屬感與認同感致使的驅動某種程度上是非理性行爲,並且一些記念品、證書等雖然沒有實質的收益,卻在情緒層面影響了開發者與社區的關係,從而進一步影響了開發者的行爲。

「我本人在生活中有點極簡主義,不少時候我會以爲記念品是一種累贅,但收到時依然會很是開心。」趙生宇做爲一個工科生一貫喜歡用很是理性的視角來看待世界,其餘學科的理論每每能給他一些新的視角。

王偉老師在上海開源信息技術協會發起的開源社會工程研究框架,旨在經過跨學科領域的協同研究促進開源研究的發展。
 

趙生宇在不一樣學科中獲得的啓發還有不少,雖然還沒求得最終解,但他已經肯定要和開源難題死磕了:「2021 年可能會產出一些內容,但不會達到預期中很是完整的理論框架的程度……實踐方面也是作好工具以後,把須要實踐的理念注入工具再去服務社區。」

如今,他還會以 Freelancer(自由職業者)的身份作外部開源諮詢,加深對開源現狀的瞭解。和研究開源的同窗呆在一塊兒時,他們也會暢想新的將來:

將來是否會有大量的開放式組織,人們能夠不用簽定獨佔勞動力的勞務合同,不用固定坐在一個工位,能夠選擇我要作什麼樣的事情,能夠選擇在哪些組織裏作事,能夠更自由地工做與創造……

【溯源】在每一場對話中,追溯關於開源的故事,認識那些極客、自由,並堅持着的開源人。

OSCHINA 推出的開源人物專訪欄目【溯源】。

溯源,意指向源頭追溯,爲開源求解。問渠哪得清如許,爲有源頭活水來。每個開源參與者,都是掀起開源浪潮最鮮活的源泉。全部開源故事,共同構建着咱們今天看到的開源世界。

開源剛出現的數十年裏,爲開源奔走的黑客團體都在遭受來自社會主流的冷漠和排斥。即使如今的軟件行業已經大喊出「擁抱開源」的口號,問題也依然存在。

咱們不知道開源貢獻者、開源佈道師,以及全部參與開源的人還會面臨多少阻礙,但給予咱們信心的是,更多的人在投身開源事業。

因此 OSCHINA 但願面向開發者社區,尋找每個積極參與開源、對開源有想法的人,瞭解他們以及他們的開源故事,窺探故事中的開源事業發展規律。

【溯源】系列文章:

適兕 :成爲開源佈道師

衛劍釩:開源圈的「世外高手」

【溯源】專欄正在徵集開源人物故事,若是你認爲本身或是身邊的人對開源作出過獨特貢獻,歡迎填寫下方問卷聯繫咱們

https://www.wjx.cn/vj/rRhC1S4.aspx

相關文章
相關標籤/搜索