【改】utf-8 的去掉BOM的方法

最近在測試中發現,linux系統中導出的文件,有記事本打開另存爲或者保存後,再次導入進linux系統,發現失敗了,對比文件內容,沒發現區別,打開二進制文件對比發現,文件頭部多了三個字符:EF BB BF。linux

經過網絡查找答案知,windows記事本等採用utf8 BOM格式,而Linux下采用UTF-8無BOM格式,上述三個字符即BOM。windows

去掉BOM方法:網絡

1. # cat INFILE | sed 's/\xef\xbb\xbf//g' > OUTFILE    ;     sed -i 's/^\xEF\xBB\xBF//g' test.txt  //直接修改測試

2. # awk '{if(NR==1)sub(/^\xef\xbb\xbf/,"");print}' INFILE > OUTFILEspa

3.# tail --bytes=+4 INFILE > OUTFILE  ##沒有判斷標示blog

相關文章
相關標籤/搜索