Stanford Parser學習入門(1)-Eclipse中配置

Stanford Parser是斯坦福大學研發的用於語法分析的工具,屬於stanford nlp系列工具之一。本文主要介紹Standfor Parser的入門用法。html

  1. 在Stanford官方網站下載最新安裝包(目前是3.6.0),點擊 下載,下載最新的model stanford-english-corenlp-2016-01-10-models.jar
  2. 解壓下載後的zip包 stanford-parser-full-2015-12-09.zip,裏面會有數據,依賴包以及demo,還有相關的source code和java doc
  3. 使用Eclipse建立項目,名稱stanfordparser,在build path中引入slf4j-api.jar,slf4j-simple.jar,stanford-parser.jar,stanford-parser-3.6.0-models.jar,stanford-english-corenlp-2016-01-10-models.jar
  4. 以ParserDemo爲例,在stanfordparser中建立類ParserDemo.java,在步驟2解壓的目錄中找到ParserDemo,將內容拷貝到當前項目的ParserDemo中
  5. 在Eclipse中右鍵點擊ParserDemo.java文件,設置運行參數Arguments爲:edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz C:/parserdata/english-onesent.txt,第一個參數是PCFG路徑,models裏已經提供,第二個參數是待分析的數據文件,在步驟2的解壓目錄的data下有
  6. 最後一步運行,輸出結果以下:

    (ROOT
    (S
    (NP (DT The) (JJ quick) (JJ brown) (NN fox))
    (VP (VBD jumped)
    (PP (IN over)
    (NP (DT the) (JJ lazy) (NN dog))))
    (. .)))java

    [det(fox-4, The-1), amod(fox-4, quick-2), amod(fox-4, brown-3), nsubj(jumped-5, fox-4), root(ROOT-0, jumped-5), case(dog-9, over-6), det(dog-9, the-7), amod(dog-9, lazy-8), nmod:over(jumped-5, dog-9)]api

相關文章
相關標籤/搜索