python處理中文字符串的問題

開始提取百科的詞條統計信息,遇到如圖一所示的問題,之前也遇到過但不知道怎麼回事,今天逐條審查才發現原來是中文字符串問題,比如這種:Python中默認情況下,賦值strs = '默認編碼是ascii',輸出strs[0],結果爲'Ä',輸出strs[10]爲'a',輸出strs[0:2]纔是'默' 因爲字符串在Python內部的表示是unicode編碼,因此,在做編碼轉換時,通常需要以unicode
相關文章
相關標籤/搜索