語言技術平臺 (Language Technology Platform)中文語言處理系統 ,哈工大社會計算與信息檢索研究中心獨立研發,(官網)。2011年,LTP正式開源。html
LTP提供了一系列中文天然語言處理工具,用戶能夠使用這些工具對於中文文本進行分詞、詞性標註、句法分析等等工做。從應用角度來看,LTP爲用戶提供了下列組件:java
-針對單一天然語言處理任務,生成統計機器學習模型的工具python
-針對單一天然語言處理任務,調用模型進行分析的編程接口git
-使用流水線方式將各個分析工具結合起來,造成一套統一的中文天然語言處理系統github
-系統可調用的,用於中文語言處理的模型文件編程
-針對單一天然語言處理任務,基於雲端的編程接口windows
若是你的公司須要一套高性能的中文語言分析工具以處理海量的文本,或者你的在研究工做創建在一系列底層中文天然語言處理任務之上,或者你想將本身的科研成果與前沿先進工做進行對比,LTP均可能是你的選擇。機器學習
是 LTP 的 Python 封裝,提供了分詞,詞性標註,命名實體識別,依存句法分析,語義角色標註的功能。工具
另外,若是想在java上使用,LTP也提供了相應的封裝: ltp4j - Language Technology Platform for Java性能
本人採用【python:3.7 LTP:3.3.1 ltp_data(模型):3.4.0 pyltp:0.1.9.1】
依賴支持狀況:
建議使用python 3.7版本,安裝參考其餘博客。
PyCharm採用最新版社區版
將下載好的壓縮包解壓,可存放在任意位置。
採用pip方式,安裝版本爲0.1.9.1
pip install pyltp==0.1.9.1
到這一步,基本的環境也就搭建完成,在安裝pyltp的時候,可能須要先安裝其餘軟件,按照cmd提示操做便可。可能還會出現一些其餘問題,如「cl.exe」字樣,安裝vs2008便可解決(微軟官網下載:VS2008ExpressENUX1397868.iso)。