利用HanLP計算中文詞語語義類似度

HanLP官方GitHub地址

HanLPjava

在java項目中配置HanLP

推薦使用Maven方法

在poem.xml中加入如下代碼git

<dependency>
    <groupId>com.hankcs</groupId>
    <artifactId>hanlp</artifactId>
    <version>portable-1.3.3</version>
</dependency>

可是在AndroidStudio中,沒有Maven,因此在build.gradle的dependencies中加入以下代碼github

compile "com.hankcs:hanlp:portable-1.3.3"

還能夠下載jar包和data包,使用hanlp.properties進行手動配置

  1. 在 IntelliJ IDEA中進入file -> project structure,在Libraries中添加jar包gradle

  2. 更改hanlp.properties中的首行,指向data包所在的位置ui

  3. 將hanlp.properties放在out -> production -> name目錄下spa

調用HanLP

import com.hankcs.hanlp.dictionary.CoreSynonymDictionary;

只須要以上語句即可以使用HanLPcode

//使用hanlp計算語義距離
double[] numarray = new double[title_list.size()];
    for (int i = 0; i < results.size(); i++) {
        for (int j = 0; j < title_list.size(); j++) {
            numarray[j] += CoreSynonymDictionary.similarity(results.get(i).name().toString(), title_list.get(j).toString());
        }
    }



文章來源於citySouth的博客xml

相關文章
相關標籤/搜索