word2vec 是 Google 於 2013 年開源推出的一個用於獲取 word vector 的工具包,它簡單、高效,所以引發了不少人的關注。因爲 word2vec 的做者 Tomas Mikolov 在兩篇相關的論文 [3,4] 中並無談及太多算法細節,於是在必定程度上增長了這個工具包的神祕感。一些按捺不住的人因而選擇了經過解剖源代碼的方式來一窺究竟,出於好奇,我也成爲了他們中的一員。讀完代碼後,以爲收穫頗多,整理成文,給有須要的朋友參考。算法
目錄工具
(一)目錄和前言
(二)預備知識
(三)背景知識
(四)基於 Hierarchical Softmax 的模型
(五)基於 Negative Sampling 的模型
(六)若干源碼細節spa
做者: peghoty .net
出處: http://blog.csdn.net/itplus/article/details/379996133d
歡迎轉載/分享, 但請務必聲明文章出處.blog