天然語言處理工具HanLP被收錄中國大數據產業發展的創新技術新書《數據之翼》

在12月20日由中國電子信息產業發展研究院主辦的2018中國軟件大會上,大快搜索獲評「2018中國大數據基礎軟件領域領軍企業」,併成功入選中國數字化轉型TOP100服務商。算法

圖:大快搜索獲評「2018中國大數據基礎軟件領域領軍企業」架構

在本屆2018中國軟件大會上,不只宣傳併成立了數字轉型促進會,還發布了由中國大數據產業生態聯盟副祕書長、《軟件和集成電路》雜誌社總編輯郭嘉凱編輯的新書——《數據之翼-引領中國大數據產業發展的創新技術》。在本書的第一章節收錄介紹了大快搜索自主研發的Hanlp技術。工具

圖:數據之翼-引領中國大數據產業發展的創新技術性能

Hanlp是由大快搜索高級研究員何晗主導開發的徹底開源的項目,具備精度高、速度快、內存省的特色。大數據

2014年,還在攻讀日語本科的何晗(大快搜索高級研究員)必定沒想到,機緣巧合研發的一款中文分詞器,在隨後幾年中幾經迭代,並在商用市場大放異彩。3d

而看似是「無意插柳柳成蔭」的事情,卻凝聚着何晗對Hanlp工匠式的錘鍊。blog

Hanlp是由一系列模型與算法組成的工具包,目標是普及天然語言處理(NLP)在生產環境中的應用。Hanlp具有功能完善、性能高效、架構清晰、語料時新、可自定義的特色:可以提供詞法分析(中文分詞、詞性標註、命名實體識別)、句法分析、文本分類和情感分析等功能。內存

相關文章
相關標籤/搜索