使用CNN+ Auto-Encoder 實現無監督Sentence Embedding (代碼基於Tensorflow)

前言 這篇文章會利用到上一篇: 基於Spark /Tensorflow使用CNN處理NLP的嘗試的數據預處理部分,也就是如何將任意一段長度的話表徵爲一個2維數組。git 本文完整的代碼在這: autoencoder-sentence-similarity.pygithub 基本思路是,經過編碼解碼網絡(有點相似微軟以前提出的對偶學習),先對句子進行編碼,而後進行解碼,解碼後的語句要和原來的句子儘量
相關文章
相關標籤/搜索