人機文本分類特徵構造——困惑度計算

時間 2020-07-25

原文原文鏈接

最近在2018smp的一個比賽中鍛鍊了一下，該任務爲文本分類，重點在於辨別人類做者和機器所寫文章的不一樣，在一番仔細斟酌以後發現二者之間的區別有如下3點：（1）語序機器所寫的可能想表達的是同樣的說法，是基於文本規則對抽取詞彙的排列，可是結果呈如今詞序的排序上卻會出現一些誤差，舉個栗子：javascript 正確的句子：這將是最好的將來。錯誤的句子：這是將最好的將來。（2）語義機器

>>阅读原文<<