hive 正則表達式 匹配中文

例如:要取出收件人 *的web

select regexp_extract('收件人爲小明的15622150839','收件人爲([\\u4E00-\\u9FFF]+)的',1 ) from tmp.t_gg  limit 1;
select regexp_extract('收件人爲小明的15622150839','收件人爲([啊-龥]+)的',0 ) from tmp.t_gg  limit 1;正則表達式

select regexp_extract('收件人爲小明的15622150839','收件人爲([\\u4E00-\\u9FA5]+)的',1 ) from tmp.t_gg  limit 1;app

若是要取出手機號碼函數

select regexp_extract('你好,李先生你的電話是15622150839','電話是([0-9])+',0 ) from tmp.t_gg  limit 1;spa

regexp_extract函數regexp

 

語法:    regexp_extract(string subject,  string pattern,  int index)orm

返回值: stringci

說明:  將字符串subject按照pattern正則表達式的規則拆分,返回index指定的字符。字符串

第一參數:   要處理的字段string

第二參數:    須要匹配的正則表達式

第三個參數:

  • 0是顯示與之匹配的整個字符串
  • 1 是顯示第一個括號裏面的
  • 2 是顯示第二個括號裏面的字段
相關文章
相關標籤/搜索