今天執行一個簡單的入庫操做,可是發現入庫的中文都是 unicode編碼,在網上查了半天,也沒檢查出什麼緣由,最後仍是找到了解決的方法,這裏只講思路。python
1:確認是什麼類型,拿到變量之後,能夠經過type來判斷究竟是什麼類型,有unicode 和str類型。json
2:若是是unicode類型,須要調用encde 和decode 方法進行解碼,加碼。app
for segment in segments: # print segment[0] # segments_en.append( [ segment[0] , wordAttr.get(segment[1]) ]) # print isinstance(segment[0], unicode); word = segment[0].encode('utf-8'); # print 'aaa',isinstance(word, str); # print isinstance(segment[0], str); # print word; item={'word':word,'wordtype':wordAttr.get(segment[1])} # print item; segments_en.append(item); # return segments,segments_en #最後做爲json字符串輸出的時候的這個ensure_ascii=False,很重要,就是經過這個,將整個json入庫的時候,顯示中文成功的。 return json.dumps(segments_en,encoding="UTF-8", ensure_ascii=False);
以此記錄編碼