分詞器在北京大學的語料上f-score達到93.9%了

連續幾天的努力終於把f-score從0.856一直提高到0.939。特徵也從原來的5中增長到了8種,分類從原來的4種加到了6種,170多W的事件,訓練出50多M的模型文件。想起本來只有區區0.856的f-score也以爲真不容易,呵呵。越到後面越以爲再提高就很困難了,基本上特徵都提取完了……目前沒有想到新的特徵。算法   在這裏也簡要說下個人特徵系列(當前字用C表示,C-1既是前一個字):C pC
相關文章
相關標籤/搜索