【NLP】自然語言處理 完整流程

自然語言處理 完整流程 第一步:獲取語料 1、已有語料 2、網上下載、抓取語料 第二步:語料預處理 1、語料清洗 2、分詞 3、詞性標註 4、去停用詞 三、特徵工程 1、詞袋模型(BoW) 2、詞向量 第四步:特徵選擇 第五步:模型訓練 1、模型 2、注意事項 (1)過擬合 (2)欠擬合 (3)對於神經網絡,注意梯度消失和梯度爆炸問題。 第一步:獲取語料 語料,即語言材料,是構成語料庫的基本單元。
相關文章
相關標籤/搜索