本做業要求來自於:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639html
1、.瀏覽2019春節各類大數據分析報告python
2、這些分析所採用數據的來源算法
春運的數據都是呈如今旅途上,因此通常數據會來自於鐵路、航空、水運等交通運輸部門,能夠採用各類平臺上春運售票的基本信息、機器和傳感器數據如旅客的定位/ GPS 系統數據等來分析。購物大數據主要仍是來自於網上的購物平臺,如天貓、淘寶等,因爲信息量龐大,是分析購物大數據的信息必要來源。分析人們的消費習慣的信息能夠來自於支付寶等支付平臺,它能夠對消費信息進行一個分類,能更好的獲取到有益的信息。春節的娛樂方式如旅遊、看電影之類的活動,主要能夠從美團、貓眼等各類APP或者政府機構、非營利組織和企業免費提供的數據等上面獲取。春節微信上面的信息發送量主要來自於移動通訊等上面獲得的數據。編程
3、大數據的呈現方式windows
大數據主要能夠有如下幾種呈現方式:微信
數據統計圖、數據圖形化、數據統計表、數據可視化、數據關係圖形化等網絡
4、大數據的特色學習
大數據的特色主要是四個「V」:大數據
1、是數據體量巨大(Volume)。截至目前,人類生產的全部印刷材料的數據量是200PB(1PB=210TB),而歷史上全人類說過的全部的話的數據量大約是5EB(1EB=210PB)。當前,典型我的計算機硬盤的容量爲TB量級,而一些大企業的數據量已經接近EB量級。spa
2、是數據類型繁多(Variety)。這種類型的多樣性也讓數據被分爲結構化數據和非結構化數據。相對於以往便於存儲的以文本爲主的結構化數據,非結構化數據愈來愈多,包括網絡日誌、音頻、視頻、圖片、地理位置信息等,這些多類型的數據對數據的處理能力提出了更高要求。
3、是價值密度低(Value)。價值密度的高低與數據總量的大小成反比。以視頻爲例,一部1小時的視頻,在連續不間斷的監控中,有用數據可能僅有一二秒。如何經過強大的機器算法更迅速地完成數據的價值「提純」成爲目前大數據背景下亟待解決的難題。
4、是處理速度快(Velocity)。這是大數據區分於傳統數據挖掘的最顯著特徵。根據IDC的「數字宇宙」的報告,預計到2020年,全球數據使用量將達到35.2ZB。在如此海量的數據面前,處理數據的效率就是企業的生命。
5、大數據對思惟方式有何影響
1、數據量的變化:人們處理的數據從樣本數據變成所有數據;
2、宏觀處理數據:因爲是獲取到全樣本數據,人們不得不接受數據的混雜性,而放棄對精確性的追求;
3、關注數據關係:人類經過對大數據的處理,放棄對因果關係的渴求,轉而關注相關關係。
事實上,大數據時代帶給人們的思惟方式的深入轉變遠不止上述三個方面。筆者認爲,大數據思惟最關鍵的轉變在於從天然思惟轉向智能思惟,使得大數據像具備生命力同樣,得到相似於「人腦」的智能,甚至智慧
6、準備、安裝python編程環境
下載安裝
https://www.jetbrains.com/pycharm/download/#section=windows
基礎學習
廖雪峯https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000
菜鳥教程http://www.runoob.com/python3/python3-tutorial.html
7、設計完成一個Mad Libs遊戲
1
2
3
4
|
name1
=
input
(
'請輸入名字:'
)
name2
=
input
(
'請再輸入名字:'
)
print
(
'有一天,{}問:有4只豬掉進河裏,你會去救嗎?\n{}:救。\n你救4(就是)只豬。'
.
format
(name1,name2))
input
(
'press any key...'
)
|