瞭解大數據的特色、來源與數據呈現方式

本做業要求來自於:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639html

1、.瀏覽2019春節各類大數據分析報告python

2、這些分析所採用數據的來源算法

      春運的數據都是呈如今旅途上,因此通常數據會來自於鐵路、航空、水運等交通運輸部門,能夠採用各類平臺上春運售票的基本信息、機器和傳感器數據如旅客的定位/ GPS 系統數據等來分析。購物大數據主要仍是來自於網上的購物平臺,如天貓、淘寶等,因爲信息量龐大,是分析購物大數據的信息必要來源。分析人們的消費習慣的信息能夠來自於支付寶等支付平臺,它能夠對消費信息進行一個分類,能更好的獲取到有益的信息。春節的娛樂方式如旅遊、看電影之類的活動,主要能夠從美團、貓眼等各類APP或者政府機構、非營利組織和企業免費提供的數據等上面獲取。春節微信上面的信息發送量主要來自於移動通訊等上面獲得的數據。編程

3、大數據的呈現方式windows

大數據主要能夠有如下幾種呈現方式:微信

數據統計圖數據圖形化數據統計表數據可視化數據關係圖形化網絡

4、大數據的特色學習

大數據的特色主要是四個「V」:大數據

        1、是數據體量巨大(Volume)。截至目前,人類生產的全部印刷材料的數據量是200PB(1PB=210TB),而歷史上全人類說過的全部的話的數據量大約是5EB(1EB=210PB)。當前,典型我的計算機硬盤的容量爲TB量級,而一些大企業的數據量已經接近EB量級。spa

        2、是數據類型繁多(Variety)。這種類型的多樣性也讓數據被分爲結構化數據和非結構化數據。相對於以往便於存儲的以文本爲主的結構化數據,非結構化數據愈來愈多,包括網絡日誌、音頻、視頻、圖片、地理位置信息等,這些多類型的數據對數據的處理能力提出了更高要求。

        3、是價值密度低(Value)。價值密度的高低與數據總量的大小成反比。以視頻爲例,一部1小時的視頻,在連續不間斷的監控中,有用數據可能僅有一二秒。如何經過強大的機器算法更迅速地完成數據的價值「提純」成爲目前大數據背景下亟待解決的難題。

        4、是處理速度快(Velocity)。這是大數據區分於傳統數據挖掘的最顯著特徵。根據IDC的「數字宇宙」的報告,預計到2020年,全球數據使用量將達到35.2ZB。在如此海量的數據面前,處理數據的效率就是企業的生命。

5、大數據對思惟方式有何影響

1、數據量的變化:人們處理的數據從樣本數據變成所有數據;

2、宏觀處理數據:因爲是獲取到全樣本數據,人們不得不接受數據的混雜性,而放棄對精確性的追求;

3、關注數據關係:人類經過對大數據的處理,放棄對因果關係的渴求,轉而關注相關關係。

事實上,大數據時代帶給人們的思惟方式的深入轉變遠不止上述三個方面。筆者認爲,大數據思惟最關鍵的轉變在於從天然思惟轉向智能思惟,使得大數據像具備生命力同樣,得到相似於「人腦」的智能,甚至智慧

6、準備、安裝python編程環境

 下載安裝

         https://www.python.org/

         https://www.jetbrains.com/pycharm/download/#section=windows 

         基礎學習

        廖雪峯https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000  

        菜鳥教程http://www.runoob.com/python3/python3-tutorial.html 

7、設計完成一個Mad Libs遊戲

1
2
3
4
name1  =  input ( '請輸入名字:' )
name2  =  input ( '請再輸入名字:' )
print ( '有一天,{}問:有4只豬掉進河裏,你會去救嗎?\n{}:救。\n你救4(就是)只豬。' . format (name1,name2))
input ( 'press any key...' )

  

相關文章
相關標籤/搜索