1.Efficient Estimation of Word Representations in Vector Space

一,語言模型 【定義】:預測每個句子在語言中出現的概率(預測句子在語言中的概率,合法的句子概率較高) 僅僅是對句子出現的概率進行建模,並不會去理解句子的意思 【例子】: 【問題】:每計算一個句子在語言模型中的概率會將整個句子所有可能出現的概率進行乘積 這樣會導致參數過多和過於稀疏,因爲一個長句子出現的特異性概率是很小的 提出基於馬爾科夫假設: 【n-gram】: 二,詞向量 【獨熱編碼】: 【分佈
相關文章
相關標籤/搜索