去除字符串中的emoji字符

  對於使用utf8編碼的mysql數據庫來講,若是字符串中存在emoji小圖像,是不能存進數據庫中的,查了一下,緣由大概是由於utf8編碼能夠存1-3個字節的字符,可是emoji是4個字節;解決方法能夠把mysql的編碼換成utf8mb4,須要相應版本的mysql;另一種方法是把字符串中全部的emoji給去除掉,而後在存進數據庫,具體的方法是:html

 

public static String filterEmoji(String source,String slipStr) {
        if(isNotBlank(source)){
            return source.replaceAll("[\\ud800\\udc00-\\udbff\\udfff\\ud800-\\udfff]", slipStr);
        }else{
            return source;
        }
    }

 

參考連接:http://www.cnblogs.com/jeyson/p/5639791.htmlmysql

     各類emoji編碼sql

相關文章
相關標籤/搜索