原文:http://my.oschina.net/xianggao/blog/79694html
什麼是bom頭?shell
在utf-8編碼文件中BOM在文件頭部,佔用三個字節,用來標示該文件屬於utf-8編碼,如今已經有不少軟件識別bom頭,可是還有些不能識別bom頭,好比PHP就不能識別bom頭,這也是用記事本編輯utf-8編碼後執行就會出錯的緣由了。其實UTF-8 的BOM對UFT-8沒有做用,是爲了支援UTF-16,UTF-32才加上的BOM,BOM簽名的意思就是告訴編輯器當前文件採用何種編碼,方便編輯器識別,可是BOM雖然在編輯器中不顯示,可是會產生輸出,就像多了一個空行。瀏覽器
相似WINDOWS自帶的記事本等軟件,在保存一個以UTF-8編碼的文件時,會在文件開始的地方插入三個不可見的字符(0xEF 0xBB 0xBF,即BOM)。它是一串隱藏的字符,用於讓記事本等編輯器識別這個文件是否以UTF-8編碼。對於通常的文件,這樣並不會產生什麼麻煩。但對於 PHP來講,BOM是個***煩。PHP並不會忽略BOM,因此在讀取、包含或者引用這些文件時,會把BOM做爲該文件開頭正文的一部分。根據嵌入式語言的特色,這串字符將被直接執行(顯示)出來。由此形成即便頁面的 top padding 設置爲0,也沒法讓整個網頁緊貼瀏覽器頂部,由於在html一開頭有這3個字符呢!最大的麻煩還不是這個。受COOKIE送出機制的限制,在這些文件開頭已經有BOM的文件中,COOKIE沒法送出(由於在COOKIE送出前PHP已經送出了文件頭),因此登入和登出功能失效。一切依賴COOKIE、SESSION實現的功能所有無效。所以,在編輯、更改任何文本文件時,請務必使用不會亂加BOM的編輯器。Linux下的編輯器應該都沒有這個問題。WINDOWS下,請勿使用記事本等編輯器。推薦的編輯器是: Editplus 2.12版本以上; EmEditor; UltraEdit(須要取消‘添加BOM’的相關選項); Dreamweaver(須要取消‘添加BOM’的相關選項) 等。對於已經添加了BOM的文件,要取消的話,能夠用以上編輯器另存一次。(Editplus須要先另存爲gb,再另存爲UTF-8。)編輯器
去掉bom頭的辦法,簡單的是下面兩種:ide
一、editplus去BOM頭的方法工具
編輯器調整爲UTF8編碼格式後,保存的文件前面會多出一串隱藏的字符(也便是BOM),用於編輯器識別這個文件是不是以UTF8編碼。編碼
運行Editplus,點擊工具,選擇首選項,選中文件,UTF-8標識選擇 老是刪除簽名,spa
而後對PHP文件編輯和保存後的PHP文件就是不帶BOM的了。.net
二、ultraedit去除bom頭辦法code
打開文件後,另存爲選項的編碼格式裏選擇(utf-8 無bom頭),肯定就ok了。
三、能夠用vi 杜撰幾個,相關命令以下:
#設置UTF-8編碼
:set fileencoding=utf-8
#添加BOM
:set bomb
#刪除BOM
:set nobomb
#查詢BOM
:set bomb?
四、shell命令刪除
grep -r -I -l $'^\xEF\xBB\xBF' yaowan.properties.bak | xargs sed -i 's/^\xEF\xBB\xBF//g'