十分鐘搞定pandas(二)

合併

連接

pandas提供各種工具以簡便合併序列,數據楨,和組合對象, 在連接/合併類型操作中使用多種類型索引和相關數學函數.

請參閱合併部分

把pandas對象連接到一起

連接

SQL樣式合併. 請參閱 數據庫style聯接

添加

添加行到數據增. 參閱 添加

分組

對於「group by」指的是以下一個或多個處理

  • 將數據按某些標準分割爲不同的組
  • 在每個獨立組上應用函數
  • 組合結果爲一個數據結構

請參閱 分組部分

分組然後應用函數統計總和存放到結果組

按多列分組爲層次索引,然後應用函數

重塑

請參閱章節 分層索引 和 重塑.

堆疊

堆疊 函數 「壓縮」 數據楨的列一個級別.

被「堆疊」數據楨或序列(有多個索引作爲索引), 其堆疊的反向操作是未堆棧, 上面的數據默認反堆疊到上一級別:

數據透視表

查看數據透視表.

我們可以從此數據非常容易的產生數據透視表:

時間序列

pandas有易用,強大且高效的函數用於高頻數據重採樣轉換操作(例如,轉換秒數據到5分鐘數據), 這是很普遍的情況,但並不侷限於金融應用, 請參閱時間序列章節

時區表示

轉換到其它時區

轉換不同的時間跨度

轉換時段並且使用一些運算函數, 下例中, 我們轉換年報11月到季度結束每日上午9點數據

分類

自版本0.15起, pandas可以在數據楨中包含分類. 完整的文檔, 請查看分類介紹 and the API文檔.

轉換原始類別爲分類數據類型.

相關文章
相關標籤/搜索