人機文本分類特徵構造——困惑度計算

最近在2018smp的一個比賽中鍛鍊了一下,該任務爲文本分類,重點在於辨別人類做者和機器所寫文章的不一樣,在一番仔細斟酌以後發現二者之間的區別有如下3點: (1)語序 機器所寫的可能想表達的是同樣的說法,是基於文本規則對抽取詞彙的排列,可是結果呈如今詞序的排序上卻會出現一些誤差,舉個栗子:javascript 正確的句子: 這將是最好的將來 。 錯誤的句子: 這是將最好的將來 。 (2)語義 機器
相關文章
相關標籤/搜索