大數據時代下的生活

  最近幾年IT都成長在一個大數據的環境下,你們動不動就要分佈式,想一想就搞大數據。有的網站明明訪問量幾臺普通的服務器就能夠搞定,非要弄分佈式,掛着雲計算的名字,卻作着屌絲的事情。安全

  雖然,大環境如此,可是爲了沾上這種高大上的氣息,也着手看一下這方面的書。服務器

  剛剛看完《大數據時代》這本書,感受收穫也蠻多的。習慣性的整理了一下書籍的思惟導圖分佈式

  這本書是國外人寫的,可是內容上還比較符合國內目前的環境,畢竟國內的大數據發展起步仍是要晚一點的。大數據

  我的吐槽

  就從法律這方面來講,感受國內的我的隱私方面法律就不怎麼看重,所以即使某些軟件或者網站侵犯了用戶的我的隱私,用戶也極少會採起必定的措施。何況不少網站或者軟件在不顯眼或者讓人不在乎的地方使用了 聲明許可......簡直是推卸責任的最佳方案。網站

  就這點來講,書中提倡,不該該採用我的許可這種相似的手段來避免大數據的使用責任,而是應該由使用方來承擔責任雲計算

  這樣,使用數據的人就會在使用過程當中,去了解什麼地方可能觸犯了用戶的隱私,什麼地方可能會讓用戶陷入尷尬的困境,從而使用模糊化或者匿名化的手段來避免。spa

  模糊化就是不給出數據的具體內容,只是粗略的描述。設計

  而匿名化就好理解了,就是隱藏掉用戶的關鍵信息。產品

 

  就目前的互聯網公司,也有不少公司根本不注重這種細節,就我特別反感的一點來講:思維導圖

  京東目前應該說是互聯網產業很火的一個產品了...因爲它的東西不少都是京東自營的,質量上老是感受比淘寶要有保障。所以,我買東西能在京東上買,就絕對不會去淘寶。可是京東的購物歷史,卻非常讓人尷尬!

  好比下面這些標紅的地方,是購物的評價區

  點擊上面的用戶名,就直接能夠看到這我的的消費歷史。固然這個歷史記錄是能夠關閉,不顯示的。可是默認上來都是開啓的,通常用戶也不會在乎。可是若是查看某XX斯這種尷尬的產品,查看其用戶,就能夠發現不少有意思的購物歷史。

  這裏就當作一個吐槽吧!這雖然不是什麼大數據,購物歷史應該說是簡單的歷史數據了。可是這也算是泄露了用戶的隱私吧。

  大數據流程

  其次呢,咱們目前的這種生活環境,天天會產生大量的數據,這些數據利用好了,能夠爲咱們進行必定的數據可視化,分析或者預測出生活中一些即將發生,咱們有意去關注的事情。

  所以好壞參半,大數據的使用還要看具體來作什麼。

 

  總的來講,其中的商機以及潛在的機會都是很是大的,如何有效的蒐集數據,如何有效的利用分析數據纔是目前最應該關注的事情。

  大致上無非都是這些步驟:

  1 數據通常都是某些應用的記錄,或者消息

  2 有了數據,須要對數據進行有效的採集,存儲,查詢。

  這裏就涉及到必定的技術了,採集須要對業務進行分析,在有效的地方進行記錄。存儲須要考慮數據的增加量,或者安全性,是否會因爲龐大的數據而存不存下,是否會由於某些故障而漏掉信息,這個時候就要高一些分佈式存儲之類的了。最後的查詢,可能會設計到一些搜索啊,MapReduce之類的。

  3 數據已經有了,就要對數據進行分析了。這一塊基於某些業務確定有不一樣的蒐集方法,具體看業務而定吧。

  4 數據的用途:既能夠採起數據的可視化進行數據的直觀展示,也能夠利用數據進行一些趨勢動向的分析預測,還能夠進行某些特定預測的預警等等。

 

  大數據的時代,重要的是數據的蒐集,相關的技術,以及如何使用這些數據。

  以上的博文,純屬我的的無聊記錄與吐槽,設計到某些互聯網的公司的部分,也是純屬但願可以作得更好。

  正如書中的最後一句話,凡是過去,皆爲序曲

  我的理解,過去的歷史數據可能就直接丟掉了,可是如今咱們應該利用這些數據,去作更有價值的事情。

相關文章
相關標籤/搜索