3種方法輕鬆處理php開發中emoji表情的問題

背景php

作微信開發的時候就會發現,存儲微信暱稱必不可少。前端

可這萬惡的微信支持emoji表情作暱稱,這就有點蛋疼了mysql

通常Mysql表設計時,都是用UTF8字符集的。把帶有emoji的暱稱字段往裏面insert一下就沒了,整個字段變成了空字符串。這是怎麼回事呢?android

原來是由於Mysql的utf8字符集是3字節的,而emoji是4字節,這樣整個暱稱就沒法存儲了。這要怎麼辦呢?我來介紹幾種方法sql

解決方案微信

一、使用utf8mb4字符集微信開發

若是你的mysql版本>=5.5.3,你大可直接將utf8直接升級爲utf8mb4字符集
這種4字節的utf8編碼可完美兼容舊的3字節utf8字符集,而且能夠直接存儲emoji表情,是最好的解決方案
至於字節增大帶來的性能損耗,我看過一些評測,幾乎是能夠忽略不計的函數

二、使用base64編碼性能

若是你由於某些緣由沒法使用utf8mb4的話,你還可使用base64來曲線救國
使用例如base64_encode之類的函數編碼事後的emoji能夠直接存儲在utf8字節集的數據表中,取出時decode一下便可google

三、幹掉emoji表情

emoji表情是個麻煩的東西,即便你能存儲,也不必定能完美顯示。在iOS之外的平臺上,例如PC或者android。若是你須要顯示emoji,就得準備一大堆emoji圖片並使用第三方前端類庫才行。即使如此,仍是可能由於emoji圖片不夠全而出現沒法顯示的狀況在大多數業務場景下,emoji也不是非要不可的。咱們能夠適當地考慮幹掉它,節約各類成本

通過一番苦苦的google,終於找到靠譜能用的代碼:

?
1
2
3
4
5
6
7
8
9
10
11
12
// 過濾掉emoji表情
function filterEmoji( $str )
{
  $str = preg_replace_callback(
    '/./u' ,
    function ( array $match ) {
     return strlen ( $match [0]) >= 4 ? '' : $match [0];
    },
    $str );
 
   return $str ;
  }

以上就是爲你們總結的PHP微信開發中涉及到emoji表情的幾種處理方法,基本思想就是遍歷字符串中的每一個字符,若是該字符的長度爲4個字節,就將其刪除。但願你們喜歡!

相關文章
相關標籤/搜索