PHP開發中涉及到emoji表情的幾種處理方法

最近幾個月作微信開發比較多,存儲微信暱稱必不可少
可這萬惡的微信支持emoji表情作暱稱,這就有點蛋疼了php

通常Mysql表設計時,都是用UTF8字符集的。把帶有emoji的暱稱字段往裏面insert一下就沒了,整個字段變成了空字符串。這是怎麼回事呢?前端

原來是由於Mysql的utf8字符集是3字節的,而emoji是4字節,這樣整個暱稱就沒法存儲了。這要怎麼辦呢?我來介紹幾種方法mysql

一、使用utf8mb4字符集


若是你的mysql版本>=5.5.3,你大可直接將utf8直接升級爲utf8mb4字符集
這種4字節的utf8編碼可完美兼容舊的3字節utf8字符集,而且能夠直接存儲emoji表情,是最好的解決方案
至於字節增大帶來的性能損耗,我看過一些評測,幾乎是能夠忽略不計的android

二、使用base64編碼


若是你由於某些緣由沒法使用utf8mb4的話,你還可使用base64來曲線救國
使用例如base64_encode之類的函數編碼事後的emoji能夠直接存儲在utf8字節集的數據表中,取出時decode一下便可git

三、幹掉emoji表情


emoji表情是個麻煩的東西,即便你能存儲,也不必定能完美顯示。在iOS之外的平臺上,例如PC或者android。若是你須要顯示emoji,就得準備一大堆emoji圖片並使用第三方前端類庫才行。即使如此,仍是可能由於emoji圖片不夠全而出現沒法顯示的狀況
在大多數業務場景下,emoji也不是非要不可的。咱們能夠適當地考慮幹掉它,節約各類成本github

通過一番苦苦的google,終於找到靠譜能用的代碼:sql

// 過濾掉emoji表情
function filterEmoji($str)
{
    $str = preg_replace_callback(
            '/./u',
            function (array $match) {
                return strlen($match[0]) >= 4 ? '' : $match[0];
            },
            $str);

     return $str;
 }

基本思想就是遍歷字符串中的每一個字符,若是該字符的長度爲4個字節,就將其刪除。
轉載自:pein0119微信

像我最近作的一個小項目,就是用方法3解決的,方便省事微信開發

本文同時刊登於個人博客 超能小紫,若是喜歡請常來玩哦函數

相關文章
相關標籤/搜索