php截取中文字符串長度的mb_substr()、mb_strcut()函數

substr()函數能夠用來分割文字,但要分割的文字若是包括中文字符每每會遇到問題,這時能夠用mb_substr()/mb_strcut這個函數,mb_substr() /mb_strcut的用法與substr()類似,只是在mb_substr()/mb_strcut最後要加入多一個參數,以設定字符串的編碼,可是 通常的服務器都沒打開php_mbstring.dll,須要在php.ini在把php_mbstring.dll打開。php


舉個例子:服務器

<?php
echo mb_substr('這樣一來個人字符串就不會有亂碼^_^', 0, 7, 'utf-8');
?>
輸出:這樣一來個人字

<?php
echo mb_strcut('這樣一來個人字符串就不會有亂碼^_^', 0, 7,'utf-8');
?>
輸出:這樣

從上面的例子能夠看出,mb_substr是按字來切分字符,而mb_strcut是按字節來切分字符,可是都不會產生半個字符的現象……網絡

上面一段是摘抄網絡上的,結果都是經本人測試得出的。

我的理解:
mb_substr()函數對英文或中文字符都表示一個單位。
mb_strcut()函數對中文字符是3個單位,英文是1個單位。

例如:
<?php
$str = "這樣abcd一來";
echo "mb_substr:".mb_substr($str, 0, 5, 'utf-8');
echo "<br>";
echo "mb_strcut:".mb_strcut($str, 0, 8, 'utf-8');
?>
輸出結果以下:
mb_substr: 這樣abc
mb_strcut:  這樣ab函數


附:測試

strlen 與 mb_strlen 的差異:
<?php 
$str="中文a字1符"; 
echo strlen($str); 
echo "<br />"; 
echo mb_strlen($str,'UTF8'); 
?>
輸出結果:
14 

編碼

相關文章
相關標籤/搜索