數據分析

數據分析介紹

  • 數據分析是什麼?
  • 數據分析能幹什麼?
  • 爲何利用Python進行數據分析?
  • 數據分析過程概述
  • 經常使用庫簡介

一 、數據分析是什麼

undefined

在咱們現在這個時代,相信大多數人都能明白數據的重要性,數據就是信息,而數據分析就是可讓咱們發揮這些信息功能的重要手段。html

2、數據分析能幹什麼

undefined

對於數據分析能幹什麼其實咱們能夠簡單的舉幾個例子:python

  1. 淘寶能夠觀察用戶的購買記錄、搜索記錄以及人們在社交媒體上發佈的內容選擇商品推薦算法

  2. 股票能夠根據相應的數據選擇買進賣出數組

  3. 今日頭條能夠將數據分析應用到新聞推送排行算法當中數據結構

  4. 愛奇藝能夠爲用戶提供個性化電影推薦服務機器學習

其實數據分析不只能夠完成像以上這樣的推薦系統,在製藥行業也可運用數據分析來預測什麼樣的化合物更有可能製成高效藥物等函數

因此說數據分析絕對是將來全部公司不可或缺的崗位,目前社會上獲取數據方式太多了,這麼多的數據,只要咱們擁有數據分析的技能,絕對能夠應付任何崗位上的工做。工具

三 、爲何利用Python進行數據分析

  1. Python的代碼語法簡單易學學習

  2. Python能夠很容易的整合C、C++等語言的代碼設計

  3. Python有大量用於科學計算的庫

  4. Python不只能夠用於研究和原型構建,同時也適用於構建生產系統

四 、數據分析過程概述

4.1 提出問題

在真正的工做場景下,每每咱們須要的處理的是多個龐大的數據集還有多是類型徹底不一樣的數據,那這個時候一個準確的問題就可讓咱們彙集與問題相關的那部分數據,爲後續的分析操做提供一個明確的方向,幫助咱們獲得一個有意義的結論。

4.2 整理數據

整理數據主要分爲三步:

I. 收集數據

經過多種途徑拿到數據,導入到Jupyter Notebook

Ⅱ. 評估數據

這一步主要是須要找出數據是否存在質量或者結構等方面的問題

Ⅲ. 清理數據

經過修改、替換、刪除等方式保證數據質量高、結構好

4.3 探索性數據分析

在這一步驟主要能夠探索而且擴充數據

4.4 得出結論

undefined

在進行完探索性數據分析以後確定會得出一個結果或者說是結論,這樣咱們就能夠根據這樣一個結論進行相應的操做,就好比說分析股票數據獲得那個大盤趨勢好能夠選擇買進,又或者說相似於萬達這樣的大型商場能夠分析那種類型的商品會比較受用戶的歡迎,以便針對性的存貨。可是具體的操做可能就須要用到機器學習或者推斷統計學來實現,這個就與數據分析不同了

4.5 傳達結果

分析的能力有多強,分析的價值就有多大。

這一步主要是向其餘人證實你發現的看法以及傳達意義

五 、經常使用庫簡介

Numpy

NumpyNumerical Python的簡寫,主要能夠用來作Python數值計算。它提供了多種數據結構、算法以及大部分涉及Python數值計算所需的接口。

  • 快速、高效的多維數組對象ndarray
  • 基於元素的數組計算以及直接對數組執行數學運算的函數
  • 用於讀寫硬盤上基於數組的數據集的工具
  • 線性代數運算、傅里葉變換,以及隨機數生成
  • 用於將C、C++、Fortran代碼集成到python的工具

Pandas

Pandas使咱們進行數據分析的一個主要工具。它所包含的數據結構和數據處理工具的設計使得Python中進行數據清洗和分析很是快捷。pandas通常也是和其餘數值計算工具一塊兒使用的,支持大部分Numpy語言風格的數組計算。PandasNumpy最大的區別就是Pandas是用來處理表格型或者異質性數據的,而Numpy則恰好相反,它更適合處理同質型的數值類數組數據

matplotlib

matplotlib是最流行的用於繪製數據圖表的python庫。

Scipy

Scipy是科學計算領域針對不一樣標準問題域的包集合。提供了強大的科學計算方法(矩陣分析、信號分析、數理分析等)

IPython和Juypyter notebook

IPython是一個增強版的Python解釋器,Juypyter notebook是一種基於Web的代碼筆記本,最初也是源於IPython項目。

1554707038466

相關文章
相關標籤/搜索