php 截取中英文混合字符串

php 截取中英文字符串

php 截取中英文字符串,就沒必要再用substr或者mb_substrphp

//截取想這樣的字符串
a李三

像不肯定字符串是什麼組成方式的時候,拿不許該用substr仍是mb_substr的時候 ,能夠試試如下方法,是否能解決的你得煩惱編碼

利用ASCIIcode

/**
 * 
 * 中英混合的字符串截取
 * @param unknown_type $sourcestr
 * @param unknown_type $cutlength
 */
function assoc_substr($sourcestr, $cutlength) {
      $returnstr = '';
      $i = 0;
      $n = 0;
      $str_length = strlen ( $sourcestr ); //字符串的字節數 
      while ( ($n < $cutlength) and ($i <= $str_length) ) {
        $temp_str = substr ( $sourcestr, $i, 1 );
        $ascnum = Ord ( $temp_str ); //獲得字符串中第$i位字符的ascii碼 
        if ($ascnum >= 224) {//若是ASCII位高與224,
              $returnstr = $returnstr . substr ( $sourcestr, $i, 3 ); //根據UTF-8編碼規範,將3個連續的字符計爲單個字符   
              $i = $i + 3; //實際Byte計爲3
              $n ++; //字串長度計1
        } elseif ($ascnum >= 192){ //若是ASCII位高與192,
              $returnstr = $returnstr . substr ( $sourcestr, $i, 2 ); //根據UTF-8編碼規範,將2個連續的字符計爲單個字符 
              $i = $i + 2; //實際Byte計爲2
              $n ++; //字串長度計1
        } elseif ($ascnum >= 65 && $ascnum <= 90) {//若是是大寫字母,
          $returnstr = $returnstr . substr ( $sourcestr, $i, 1 );
          $i = $i + 1; //實際的Byte數仍計1個
          $n ++; //但考慮總體美觀,大寫字母計成一個高位字符
        }elseif ($ascnum >= 97 && $ascnum <= 122) {
            $returnstr = $returnstr . substr ( $sourcestr, $i, 1 );
            $i = $i + 1; //實際的Byte數仍計1個
            $n ++; //但考慮總體美觀,大寫字母計成一個高位字符
        } else {//其餘狀況下,半角標點符號,
          $returnstr = $returnstr . substr ( $sourcestr, $i, 1 );
          $i = $i + 1; 
          $n = $n + 0.5; 
        }
      }
      return $returnstr;
}

經過這樣就能夠很方便的進行一些字符串的截取等,避免由於字節不一樣而截取亂碼或者不對的狀況。ci

相關文章
相關標籤/搜索