基於LSTM實現新聞文本分類

  1 相關知識介紹 目前對於中文語句的分析來講,其分詞技術多采用Jieba分詞技術,該技術是基於前綴詞典實現高效的詞圖掃描,生成句子中漢字所有可能成詞情況所構成的有向無環圖(DAG);採用了動態規劃(DP)查找最大概率路徑,找出基於詞頻的最大切分組合;對於像各類專有分詞、縮寫詞與新增詞等未登錄詞沒有收錄在分詞詞表中,但是必須要切分出來,是採用基於漢字成詞能力的HMM模型,使用了維特比(Viter
相關文章
相關標籤/搜索