讀<<大數據時代>>的一些感想

 

第一次據說<<大數據時代>>這本書,是在網上看到的央視搞的一個2013中國好書評選活動推薦的25本「中國好書」的榜單中看到的。而後迅速上豆瓣上查看了一下對該書的評價,一看很是高,再加上央視的推薦是從2013在中國出版的40萬冊圖書中選出25本,能夠說是精華了。果判定了一本,花了三天時間讀完了。
 
大數據這個名詞或者說概念從被提出開始,通過短短几年的發展,已經傳的沸沸揚揚了,常常見諸媒體上。好像哪家媒體的科技板塊天天不弄一些這樣的新聞條,它就顯得不夠檔次同樣。這是一個咱們耳熟能詳的概念,聽得多了,有時候都顯得有點麻木了。我常常上網看一些分析師的文章,各類分析,我總結了一下大體上都是在微觀層面上說事,並且都是細枝末節的事,直到出現了<<大數據時代>>這本書。<<大數據時代>>不像通常的分析文章的碎碎念,而是從宏觀層面上來分析大數據對咱們社會的各個方面的影響,是一本值得閱讀的好書。(有點打廣告的嫌疑好~~哈哈)
 
從哲學家的角度來看這個世界是物質的世界,從計算機科學家的角度來看這個世界,這個世界是bit的世界,並且發展到如今這個時候,這個世界已是流動的bit世界了。所以從根本上來講這個世界的本質是數據。物質世界的這種特性,不是一開始就被人們所認識的。工業革命把這個社會分紅了兩個階段,第一個階段能夠叫作靜止的世界(指工業革命前的世界),第二個階段叫作動態的世界(指工業革命後的世界)。工業革命前,人類的社會積累的數據是有限的,到了動態的社會,隨着電氣化信息化的到來,社會愈來愈動態,而這種動態加重了人類生產數據,更重要的是有了相關的技術來記錄這些數據。由此出現了一個大數據的時代。
 
就像這本書的一篇序言裏講的同樣,大數據的發展核心動力來源於人類測量 記錄 分析世界的渴望。從古至今,人類永遠對未知充滿恐懼,迫切想知道下一刻會發生什麼。而大數據偏偏能夠知足人們這方面的需求,把將來的不肯定性經過預測變成「肯定性」,而後呈現給人看,至於這個肯定性有多大的真實性,我相信技術能解決這個問題,這也就是大數據的價值和將來在社會中的做用,知足人們對未知渴望瞭解的心理。
 
文中的一個使人印象深入的觀點是大數據時代,相關關係將取代因果關係,或者說相關關係更重要,而因果關係已經不那麼重要了。對於此觀點四川電子科技大學教授周濤(中國最年輕的的大學教授,大牛呀~~,有關他的傳奇經歷你們能夠網上扒一下)認爲從大處講,放棄對因果性的追求,就是放棄了人類凌駕於計算機智商的智力優點,是人類自身的放縱和墮落。若是將來某一天機器和計算徹底接管了這個世界,那麼這種放棄就是末日之始。因果關係是這個世界存在的一種基礎關係,能夠說由於因果關係的存在,人類才能瞭解這個世界。若是有一天全部的人都不在去探尋這個世界中未發現的因果關係了,徹底按照相關關係來分析這個世界,理論上來講不是不能夠,並且我相信當數據積累足夠多的時候,相關關係是能夠取代因果關係的。我所擔憂的是人類過度依賴於相關關係來分析這個世界,放棄之前本身積累的優點,頗有可能形成被機器取代的下場。可是,咱們這個世界發展到如今,愈來愈複雜,須要考慮的因素不少,不少的事情咱們必須依賴於機器,咱們能作的只是在一些核心的層面上減小對機器的依賴,切勿拋棄對世界因果關係的探索。
 
關於大數據的一個當下最火的也是被說起最多的一個觀點是:將來咱們能夠真正實現計劃經濟想作的事。咋一看這個觀點有點懵,說的是什麼呀,咱們不是處在一個市場經濟的時代嗎,市場經濟不是優於計劃經濟嗎,回到計劃經濟不是歷史的倒退嗎?我相信不少的讀者看到這個觀點,腦中閃現的多是這樣的一些疑問。不急,聽我慢慢給你講來。這種觀點的設想是這樣的:利用電子商務平臺積累的無限的用戶消費行爲的習慣的數據,加上大數據的分析技術,利用C2B,真正實現個性化的消費,徹底按照用戶的需求來進行社會生產。鐺鐺檔~~,是否是有點計劃經濟的味道了。說實在的當我第一次看到這個觀點的時候,也是感到無比的震撼,太帥氣了。我想說的是:這種時代的到來不是沒有可能,並且又是將來我看好的社會發展方向,前提是配套的設施獲得位,像物流呀,大數據分析技術啦等等。
 
<<大數據時代>>這本書中把大數據這個鏈條分紅三個部分,也就是說在將來的商業社會中,有三種的大數據公司:基於技術的公司、基於數據的公司、基於思惟的公司。這三個公司會在將來的大數據商業時代共存,並且有可能能是相互依存的。由於畢竟像google amazon這種有數據、有技術、有大數據思惟的公司不是不少,更多的企業不能徹底擁有這三樣東西,所以須要的你們的合做。
 
這本書中着重講了大數據時代的思惟變革的重要性。我記得做者舉得一個例子是這樣的:在 2000年的時候,微軟研究中心的 米歇爾 ·班科(Michele Banko )和埃裏克·布里爾( Eric Bill)一直在尋求改進 Word程序中語法檢查的方法。可是他們不能肯定是努力改進現有的算法、研發新的方法,仍是添加更加細膩精緻 的特色更有效。因此,在實施這些措施以前,他們決定往現有的算法中添加更多的數據,看看 會有什麼不一樣的變化。不少對計算機學習算法的研究都創建在百萬字左右的語料庫基礎上。最 後,他們決定往 4種常見的算法中逐漸添加數據,先是一千萬字,再到一億字,最後到十億。 當數據只有 500萬的時候,有一種簡單的算法表現得不好,但當數據達 10億的時候,它變成 了表現最好的,準確率從原來的 75%提升到了95% 以上。與之相反地,在少許數據狀況下運行得 最好的算法,當加入更多的數據時,也會像其餘的算法同樣有所提升,可是卻變成了在大量數 據條件下運行得最很差的。它的準確率會從 86%提升到94% 。 後來,班科和布里爾在他們發表的研究論文中寫到, 「如此一來,咱們得從新衡量一下更多的人力物力是應該消耗在算法發展上仍是在語料庫發展上。 」 
有一句叫作:你的思惟有多遠,你的將來就有多遠。大數據時代是時候改變咱們之前的思惟方式了。
 
關於大數據,當下不少的說法,每一個企業都在談論大數據,可是每一個企業又不知道怎麼開始幹大數據。我不知道什麼緣由,個人感受是思惟的問題。貌似咱們如今強調的大數據大數據強調的是數據量的大,而忽略大數據最本質的是數據。大數據是一個宏觀上的概念或者說全局性的概念,它指的是整個社會的數據量在增大,愈來愈大,咱們這個社會愈來愈變成一個數據的社會,固然不排除單一數據的量很大的狀況出現,可是沒有很大很大數據就幹不成事了嗎?來讓咱們看一個例子:prada收集在它的店裏顧客試衣的一些信息,看有哪些是人們進了試衣間,而後買了這件衣服的,看又有哪些是進了試衣間沒買走衣服的,而後迅速對沒被買走的衣服進行一些樣式、顏色等方面的修改,再推向市場。記住,大數據的本質在於數據,大隻是它在整個宏觀社會總體上的一個表現。
 
 
<<大數據時代>>這本書中內容不少,並且頗有深度,講到了大數據時代的思惟變革、大數據時代的商業變革、大數據時代的社會管理變革,信息量不少,並且文中列舉了無數經典而又有說服力的例子,很是的漂亮,是一本可貴一見的好書。
相關文章
相關標籤/搜索