實用的工具,有趣的人

1998年的9月4日,拉里·佩奇和謝爾蓋·布林將Google帶到這個世界。就在前幾天,Google剛剛過了20歲生日。通過20年的發展,Google早已不是當初的小做坊了,而是發展成爲被你們公認的全球最大的搜索引擎公司。20年間,Google不只在搜索技術上表現頗爲出色,在大數據、雲計算、AI等各個方面都有着巨大的貢獻。
程序員


咱們都知道,現在世界已經從互聯網時代走向大數據時代。數據幾乎已經成爲各個互聯網公司的命脈,數據分析師這一職位也應運而生(雖然我本人不是數據分析師),可是我對數據分析很感興趣。剛剛過完20歲生日的Google此次能夠算是給數據分析師和數據分析愛好者們送上了一份大禮(果真是大公司,本身過生日還給咱們送禮)——一款叫作Google Dataset Search的搜索引擎。它是一款專門用來搜索數據集的搜索引擎,搜索結果中包括了數據集的建立者,發佈時間,數據集的收集方式,數據集的使用條款以及對數據集的描述。web


還記得我當初自學大數據知識的時候,往往到了想要親自動手試一試的時候,老是爲找不到合適的數據集而苦惱。最後,我決定自學Python爬蟲,想要什麼數據都本身動手爬。然而,這種工做仍是挺繁瑣的,也許對我這種自學的愛好者無所謂,反而還多掌握一門技術。但對於專門從事數據科學工做的人來講可能會以爲很痛苦。微信


隨着Google Dataset Search的誕生,這種「巧婦難爲無米之炊」的尷尬終於一去不復返了。如今你想要什麼數據集均可以直接搜索,簡直不要太方便。編輯器


這個網站的地址是:工具

https://toolbox.google.com/datasetsearch大數據


能夠訪問的同窗能夠上去體驗一下,目前仍是Beta版,沒辦法訪問的同窗,看看這個界面先過過癮吧。flex


以上就是今天要介紹的實用的工具。下面再來介紹一個有趣的人,一樣是和DataSet Search有關。網站


要介紹的這我的呢,做爲程序員必定很熟悉,就是Linux之父Linus Torvalds。懷着對大神的崇敬之情,我今天用Dataset Search搜索了一下Linus。結果果真沒有令我失望,先來展現一下搜素結果。搜索引擎

第一條是Linus Torvalds Rants,能夠理解爲Linus的粗話(這是什麼鬼?黑人問號臉)。google


咱們注意到數據集的描述爲Linus2012年到2015年郵件的粗話合集。到這裏有些懷疑這個數據集的真實性,不過對大神崇敬之情驅動着我點了進去,看看大神是怎麼罵人的,

這是數據集的部分截圖,連接也都是能夠直接訪問的。


總之,Linus大神說話仍是挺文明的,這種作法也很是有Linus的風格。(這裏順便提一下,Linus曾經在Linux內核代碼中記錄了女兒的生日)怎麼樣,是否是今天才發現原來Linus是如此有趣的人?


最後,國內某公司CEO說要「再」次擊敗Google,我以爲他們仍是先多作些像這樣有意義的事吧。

本文分享自微信公衆號 - 代碼潔癖患者(Jackeyzhe2018)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索