Linux 字符編碼 查看與轉換

Linux 查看文件編碼格式

  1. Vim 查看文件編碼linux

    set fileencoding   // 便可顯示文件編碼格式

    若想解決Vim查看文件亂碼問題, 能夠在 .vimrc 文件添加vim

    set encoding=utf-8   fileencoding=utf-8, cp936,gb2312 等
  2. enca (yum install enca) 查看文件編碼編碼

    enca   filename   // enca對某些GBK編碼文件並不識別  Unrecognized encoding

文件編碼轉化

  1. Vim直接轉化文件編碼unix

    set fileencoding=utf-8
  2. iconvcode

    iconv -f encoding -t encoding inputfile

    例如: 將一個utf-8 編碼轉化爲GBK編碼utf-8

    iconv -f utf-8  -t gbk  file -o file2
    iconv命令用於轉換指定文件的編碼,默認輸出到標準輸出設備,亦可指定輸出文件。 
    用法: 
            iconv [選項...] [文件...]  
    有以下選項可用:  
      輸入/輸出格式規範:  
          -f, --from-code=名稱 原始文本編碼 
          -t, --to-code=名稱 輸出編碼  
      信息: 
          -l, --list 列舉全部已知的字符集    
      輸出控制: 
          -c 從輸出中忽略無效的字符  
          -o, --output=FILE 輸出文件  
          -s, --silent 關閉警告  
          --verbose 打印進度信息  
          -?, --help 給出該系統求助列表  
          --usage 給出簡要的用法信息 
          -V, --version 打印程序版本號    
        例子:  
            iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt  
        這個命令讀取aaa.txt文件,從utf-8編碼轉換爲gb2312編碼,其輸出定向到bbb.txt文件。
  3. enconv
    將一個GBK編碼轉化爲 utf-8編碼input

    enconv -L zh_CN -x utf-8 filename
  4. dos2unix : window 文件 cpoy 到 linux 格式轉化
    • DOS下的文本文件是以\r\n做爲斷行標誌的
    • Mac文本是以 \r 做爲換行標誌
    • Linux文本以 \n 做爲換行標誌
    dos2unix filename
相關文章
相關標籤/搜索