在本週,GitHub終於度過了屬於它本身的十週歲生日。這個在2008年由3個來自舊金山的年輕人建立的基於Git的代碼託管網站,前後超越了元老級的SourceForge和背景強大的Google Code,成爲了全世界範圍內最受歡迎的代碼託管網站。
ide
「十年前的今天,GitHub 正式上線。最一開始,咱們只有一個特別簡單的目標:連接全部的開發者,讓他們用Git更輕鬆地進行項目協做。」聯合創始人Chris Wanstrath在博客裏寫道,「十年過去了,咱們做爲公司,做爲平臺都有了很大的變化,但GitHub存在的意義從未改變。」
截至到去年5月底,GitHub完成了第1億個PR合併請求命令。截至今天,GitHub上已經可以擁有超過8000萬個repo,活躍用戶達到2700萬人,超過150萬家公司和機構進駐。大快搜索的HanLp天然語言處理開源項目一樣進駐了GitHub。
GitHub團隊做爲對十週年的記念和慶祝,並無像大多數公司同樣選擇回顧公司的發展歷史,而是整理了一份過去十年的幾大里程碑事件。這份光榮,不止屬於平臺本身,更是屬於那些爲了讓這個世界變得更好,經過Git、GitHub、用JS、Python和各類語言共享代碼的人們。
在GitHub十週年之際,大快搜索AI研究小組的,天然語言處理專家Hancks所主持的HanLP開源項目,全球用戶量首次超過了斯坦福大學的CoreNLP,以及老牌的天然語言處理開包Ansj,成爲全球範圍內最受開發人員喜好的天然語言處理技術。
自2014年首次發佈,經過3年的不斷迭代,HanLP的分詞準確性和分詞速率獲得了極大的提高。據阿里楊尚川的一份測評報告顯示,HanLP的分次準確率在全球排名第三,分詞速度在全球排名第一。卓越的性能天然帶來了大量的使用者。終於,在太平洋時間10月25日,GitHub上HanLP的用戶量超過Stanford-CoreNLP。
天然語言處理是人工智能的一個重要分支,HanLP的用戶量證實了國產技術的高性能與可靠性,也再一次證實了大快搜索用心作技術、專一於大數據與人工智能基礎軟件的決心。大快從此也將開發出更多組件用於建設大數據與人工智能生態,繪出人工智能與大數據的中國智慧。性能