word2vector 2

接着上一篇講。 中文解析鏈接!!!很清楚!!! 我們發現構建一個這樣的三層網絡需要太多的features 了,這樣會使計算大大增加。所以我們必須做一些修改, 1.在模型中將常用單詞對或短語視爲單個「單詞」。比如:「我擦」的意思和 「我」 & 「擦」是不一樣的。在此不再詳細解釋 2.對頻繁的詞進行子採樣以減少訓練實例的數量。 3.用「負採樣」的技術修改優化目標,這會使每個訓練樣本只更新一小部分模型的
相關文章
相關標籤/搜索