python爬蟲坑

錯誤提示以下:

'latin-1' codec can't encode character '\u014d' mysql

問題緣由:

爬取到的數據中含有特殊字符,存入數據庫時出錯。sql

解決辦法:

connection = pymysql.connect(
            host = '1.1.1.1',#主機名
            user = 'xxx',#用戶名
            password = 'xxx',#密碼
            db = 'test',#數據庫
            use_unicode = True,
            charset = 'utf8'#數據庫字符集
        )

在使用pymysql鏈接數據庫的過程當中,connection配置中須要加入charset=utf8屬性,不然爬取到的數據存入數據庫時有字符集編碼問題。

相關文章
相關標籤/搜索