ubuntu中文亂碼--添加中文字符集

在Ubuntu支持中文後(方法見上篇文章),默認是UTF-8編碼,而Windows中文版默認是GBK編碼。爲了一致性,一般要把Ubuntu的默認 編碼改成GBK。固然你也能夠不改,但這會致使咱們在兩個系統之間共享文件變得很是不方便,Samba共享的文件也總會有亂碼出現。總不能每次傳完文件都 人肉轉碼一次吧。ubuntu

ubuntu轉碼須要分爲幾個部分分別進行:vim

1. 系統級app

Ubuntu默認是不支持GBK的。這裏若不更改,則後續步驟均沒法生效。編輯器

添加中文字符編碼:字體

  1. $sudo vim /var/lib/locales/supported.d/local  

#添加下面的中文字符集編碼

  1. zh_CN.GBK GBK  
  2. zh_CN.GB2312 GB2312  
  3. zh_CN.GB18030 GB18030  

使其生效:spa

  1. $sudo dpkg-reconfigure locales  

2. vim.net

雖然Ubuntu已經支持GBK了,但默認的輸入/顯示方式仍然是UTF-8,要想改變就須要咱們逐一去設定。VIM首當其衝。
打開vim的配置文件,位置在/etc/vim/vimrc
在其中加入 命令行

  1. set fileencodings=utf-8,gb2312,gbk,gb18030  
  2. set termencoding=utf-8  
  3. set encoding=gbk


保存退出 unix

  1. source /etc/vim/vimrc  

此時vim就能正確顯示中文了。
--------------------------------------------------------------'

3. 讓Terminal默認GBK

雖然VIM已經可以編寫/打開GBK文件,但cat <filename>時咱們發現仍然是亂碼。此時咱們須要更改Terminal的默認編碼方式。

在terminal面板上選擇菜單欄中的termianl-->set character encoding-->add or remove,而後在左側選擇GB2312或GBK,添加到右側,關閉。

而後在terminal面板上的 termianl-->set character encoding選定增長的中文編碼,而後就能夠正常顯示中文了。
4. pdf

  1. $sudo apt-get install xpdf-chinese-simplifiedxpdf-chinese-traditional #安裝pdf的中文字體  
  1. $sudo apt-get install poppler-data #安裝解決pdf中文顯示亂碼的軟件  
  2. $cd /etc/fonts/conf.d   
  3. $sudo cp 49-sansserif.conf 49-sansserif.conf_backup #先備份下  
  4. $sudo rm 49-sansserif.conf #刪除  


在打開pdf文件,就能呢個正常顯示中文了

5. gedit
缺省配置下,用 Ubuntu 的文本編輯器(gedit)打開 GB18030/GBK/GB2312 等類型的中文編碼文本文件時,將會出現亂碼。

出現這種狀況的緣由是,gedit 使用一個編碼匹配列表,只有在這個列表中的編碼纔會進行匹配,不在這個列表中的編碼將顯示爲亂碼。您要作的就是將 GB18030 加入這個匹配列表。

命令行方式,適用於全部 Ubuntu 用戶。
複製如下命令到終端中,而後回車便可:

gconftool-2 --set --type=list --list-type=string /apps/gedit-2/preferences/encodings/auto_detected "[UTF-8,CURRENT,GB18030,BIG5-HKSCS,UTF-16]"

圖形化方式,適用於 Ubuntu 用戶,而不適用於 KUbuntu/XUbuntu 用戶。
您能夠遵循如下步驟,使您的 gedit 正確顯示中文編碼文件。

按下 Alt-F2,打開「運行應用程序」對話框。
在文本框中鍵入「gconf-editor」,並按下回車鍵,打開「配置編輯器」。
展開左邊的樹節點,找到 /apps/gedit-2/preferences/encodings 節點並單擊它。
雙擊右邊的 auto_detected 鍵,打開「編輯鍵」對話框。
單擊列表右邊的「添加」按鈕,輸入「GB18030」,單擊肯定按鈕。
列表的最底部新增長了一個「GB18030」。單擊選中它,並單擊右邊的 「向上」 按鈕直到 「GB18030」 位於列表的頂部爲止。
單擊肯定按鈕,關閉配置編輯器。
gedit3.x版本設置

終端輸入dconf-editor

展開org/gnome/gedit/preferences/encodings

auto-detected的value中加入’GB18030′,加在uft8後面;

show-in-menu的value中加入’GB18030′

如今,您的 gedit 應該可以順利打開 GB18030 編碼的文本文件了。

gedit 3.X版本命令設置:gsettings set org.gnome.gedit.preferences.encodings auto-detected "['UTF-8','GB18030','GB2312','GBK','BIG5','CURRENT','UTF-16']"

6. 中文文件名亂碼轉換

由於之前使用zh_CN.GB* 如今使用zh_CN.UTF-8,因此文件名編碼有問題。
convmv -f gbk -t utf-8 -r --notest /filePath

 

參考:

http://blog.csdn.net/zbunix/article/details/8948139

相關文章
相關標籤/搜索