[perl]Wide character in print報錯

時間 2019-11-21

標籤 perl wide character print 報錯欄目 Perl 简体版

原文原文鏈接

用perl寫文本處理程序，或者寫服務器端腳本的時候，經常會遇到「Wide character in print」的警告或者錯誤。 這是由於在程序中處理中文等寬字符時，perl不能識別要處理的內容。 首先要知道perl只能處理兩種編碼：ascii碼和utf-8。ascii碼是不多的，像中文、日文、韓文等字符要想能被perl處理，只能用 utf-8編碼方式。字符串在perl內部的存儲格式以下圖：服務器

當flag是1的時候，perl就會把那個字符串當作utf-8編碼的字符來處理；若是是0，perl就不能認知字符串中除了 ascii碼以外的字符，這個時候，就會報出「Wide character in print」的警告或者錯誤。 舉個例子，你要程序中處理‘當歷史成爲歷史’這個字符串，若是你的程序文件是utf-8編碼的話，通常狀況下直接處理就好了，由於這時字符串的utf8-flag是打開的。若是你的程序文件是gb2312的話，那麼你就須要把那個字符串的utf8-flag打開。可是，通常還會有這樣的問題，由於這個字符串是gb2312編碼的，因此你要作兩件事情：將字符串的編碼轉爲utf-8和打開utf8-flag。 use Encode; use strict; my $str = "當歷史成爲歷史"; Encode::_utf8_on($str); print $str. "\n"; Encode::_utf8_off($str); print $str. "\n"; 將上面的這段程序存到文件裏，試圖運行的時候就會報錯：Wide character in print at test.pl line 6。這就是由於utf8-flag被關閉，perl不能識別字符串。 固然，在每一個處理寬字符的地方加上Encode::_utf8_on函數確實是個解決辦法。可是通常來講，在每一個地方都加上這樣的函數，既在編寫程序的時候麻煩，維護的時候更麻煩。 這裏還有一個更好的辦法：在程序文件的頭部加上如下內容 use utf8; binmode(STDIN, ':encoding(utf8)'); binmode(STDOUT, ':encoding(utf8)'); binmode(STDERR, ':encoding(utf8)');ide

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。