神經網絡在文本分類中的應用

在自然語言的文本分類中,主要使用兩類模型,一類是使用傳統的機器學習模型,如樸素貝葉斯,最大熵,支持向量機等,第二類就是使用神經網絡模型,包括CNN和RNN。傳統的機器模型在分類前首先要做特徵工程,例如把文本轉換成詞袋,並轉化爲TF-IDF矩陣,然後再做分類。而使用神經網絡模型可以使它自己提取特徵並進行文本分類,並能獲得優於傳統機器學習模型的能力。 CNN模型的文本分類 CNN原來是用於對圖像分類,
相關文章
相關標籤/搜索