pandas讀取各種sql數據源

時間 2019-11-26

標籤 pandas 讀取各種 sql 數據欄目 SQL 简体版

原文原文鏈接

大數據分析中，咱們常常須要使用pandas工具讀取各種數據源並將結果保存到數據庫中。html

本文總結了一些讀取和寫入經常使用數據庫數據的一些方法，包括mysql，oracle，impala等。python

其中讀取數據庫數據有兩種方法，一種是DBAPI2 connection，另外一種是SQLAlchemy engine。下面介紹這兩種方法。mysql

1、讀寫mysql數據sql

1.首先安裝python鏈接mysql的驅動，以mysql.connector爲例數據庫

2.pandas讀取數據，分兩種方式：api

#DBAPI2 connection方式鏈接
import mysql.connector
import pandas as pd

conn=mysql.connector.connect(host='127.0.0.1',user='root', passwd='password', db='test')
sql='select * from mytable'
df=pd.read_sql(sql,conn)

#SQLAlchemy engine方式

from sqlalchemy import create_engine
import pandas as pd

engine = create_engine('mysql+mysqlconnector://root:password@10.39.211.198:3306/test')
df=pd.read_sql(sql,engine )

3.pandas寫入數據到mysql只有SQLAlchemy engine方式oracle

#SQLAlchemy engine方式

from sqlalchemy import create_engine
import pandas as pd

engine = create_engine('mysql+mysqlconnector://root:password@10.39.211.198:3306/test')
df.to_sql('mytable',con=engine,if_exists='append',index=False)

2、讀寫oracle數據app

1.首先安裝python鏈接oracle的驅動cx_oracle工具

第二、3步驟同上，只是數據庫驅動的寫法不一樣。大數據

oracle寫成：

from sqlalchemy import create_engine

conn=cx_Oracle.connect('scott','tiger','10.0.0.100:1521/ORCL')
engine=create_engine('oracle://scott:tiger@10.0.0.100:1521/ORCL', echo=True)

3、讀寫impala數據

1.首先安裝python鏈接impala的驅動（參照個人博客http://www.cnblogs.com/dotafeiying/p/6956265.html）

第二、3步驟同上，只是數據庫驅動的寫法不一樣。

impala寫成：

from impala.dbapi import connect
from sqlalchemy import create_engine

conn = connect(host='127.0.0.1',port=21050,database='db')
engine=create_engine('impala://127.0.0.1:21050/db')

用pandas往impala寫入數據時可能會拋出數據類型錯誤，

要注意impala的數據類型，下面給一個我在實際項目中解決的例子：

from sqlalchemy.sql.sqltypes import String

df.to_sql('address',con=sqlconn,if_exists='append',index=False,dtype={'address': String})

必定要加後面的 dtype={'address': String}

如今，你就能夠盡情的用pandas進行數據分析了。

以上是我我的的一些總結。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。