Py之zhon:zhon庫的簡介、安裝、使用方法之詳細攻略python
目錄spa
zhon庫的簡介code
zhon庫的安裝blog
一、在字符串中查找CJK字符、驗證拼音音節、單詞或句子:字符串
zhon庫的簡介
Zhon是一個Python庫,它提供了中文文本處理中經常使用的常量。pip
包括經常使用常量:class
- 中日韓文字和部首
- 中文標點符號
- 漢語句子規則表達模式
- 拼音元音、輔音、小寫、大寫和標點符號
- 拼音音節、單詞和句子規則表達模式
- 諸印文字
- 竹音音節規則表達模式
- CC-CEDICT字符
zhon庫的安裝
pip install zhon方法
zhon庫的使用方法
一、在字符串中查找CJK字符、驗證拼音音節、單詞或句子:
在字符串中查找CJK字符: >>> re.findall('[%s]' % zhon.hanzi.characters, 'I broke a plate: 我打破了一個盤子.') ['我', '打', '破', '了', '一', '個', '盤', '子'] 驗證拼音音節、單詞或句子: >>> re.findall(zhon.pinyin.syllable, 'Yuànzi lǐ tíngzhe yí liàng chē.', re.I) ['Yuàn', 'zi', 'lǐ', 'tíng', 'zhe', 'yí', 'liàng', 'chē'] >>> re.findall(zhon.pinyin.word, 'Yuànzi lǐ tíngzhe yí liàng chē.', re.I) ['Yuànzi', 'lǐ', 'tíngzhe', 'yí', 'liàng', 'chē'] >>> re.findall(zhon.pinyin.sentence, 'Yuànzi lǐ tíngzhe yí liàng chē.', re.I) ['Yuànzi lǐ tíngzhe yí liàng chē.']