python unicode 引起的血案!!! unicode

今天執行一個簡單的入庫操做,可是發現入庫的中文都是 unicode編碼,在網上查了半天,也沒檢查出什麼緣由,最後仍是找到了解決的方法,這裏只講思路。python

    1:確認是什麼類型,拿到變量之後,能夠經過type來判斷究竟是什麼類型,有unicode 和str類型。json

    2:若是是unicode類型,須要調用encde 和decode 方法進行解碼,加碼。app

    

for segment in segments:
#         print segment[0]
#           segments_en.append(   [ segment[0] ,   wordAttr.get(segment[1]) ])
#         print isinstance(segment[0], unicode);
        word = segment[0].encode('utf-8');
#         print 'aaa',isinstance(word, str);
#         print isinstance(segment[0], str);
#         print word;
        item={'word':word,'wordtype':wordAttr.get(segment[1])}
#         print item;
        segments_en.append(item);
#     return segments,segments_en

#最後做爲json字符串輸出的時候的這個ensure_ascii=False,很重要,就是經過這個,將整個json入庫的時候,顯示中文成功的。
    return json.dumps(segments_en,encoding="UTF-8", ensure_ascii=False);

以此記錄編碼

相關文章
相關標籤/搜索