你們在讀個人文章以前能夠看看這篇文章:http://my.oschina.net/crxy/blog/412202 測試
很感謝這篇文章的做者:http://blog.csdn.net/tjcyjd/article/details/43453007 編碼
他給了我啓發,這篇文章裏面有lucene的源碼。spa
上一篇文章我提到在CDH中如何添加IK分詞,根據上面兩篇文章。我依然沒法添加自定義詞庫。通常來講不能添加詞庫有兩個緣由:solr與IK版本問題、詞庫編碼問題,上面的文章有提到。並且第二篇博客的rar文件中有一個pdf,已經很詳細了。.net
可是經過各類方法,我依然不能添加自定義詞庫。很苦惱。後來我打開了源碼,才發現做者默認的詞庫是main2012.dic。我把IKAnalyzer2012FF_u1.jar用winrar解壓,把IKAnalyzer2012FF_u1\org\wltea\analyzer\dic\main2012.dic取出來,把本身的詞庫放進去,再把main2012.dic放入jar包中就能夠了。因爲沒有修改class文件,就不須要編譯了,直接用main2012.dic覆蓋jar中main2012.dic的就能夠了。blog
剩下的就和我上一篇博客同樣,添加IK分詞器,就能夠了。你們能夠對分詞的fieldtype測試,便發現成功了。get
這種修改源碼文件是下下策,若是按照前面那兩篇文章能夠實現,我不建議使用我這種方法。源碼