Zipf's law分析

簡單地說,Zipf發現一個詞在一個有相當長度的語篇中的等級序號(該詞在按出現次數排列的詞表中的位置,他稱之爲rank,簡稱r)與該詞的出現次數(他稱爲frequency,簡稱f)的乘積幾乎是一個常數(constant,簡稱C)。用公式表示,就是r × f = C。例如,他根據M. L. Hanley(1937)中有關James Joyce Ulysses的用詞數據,從中抽取了第10、20等序號的詞
相關文章
相關標籤/搜索