【項目小結】GEC模型中的難點:分詞(Tokenizer)與回譯(Backtranslation)

前排提示本文涉及的數據集及外部文件在如下連接共享。包括 Lang-8 語料庫,詞形轉換表(涉及79024組變換)與一些有用的pickle文件。算法 連接:https://pan.baidu.com/s/1fW266ZSLoZeEaRCl2yVQCg 提取碼:yfhm 序言 GEC模型的概念及解決方案能夠參考我以前寫的一些論文提綱,但不管採用什麼樣的解決思路,都繞不開不少瓶頸性的問題。筆者根據本身
相關文章
相關標籤/搜索