一種解決bert長文本匹配的方法

時間 2020-12-23

原文原文鏈接

引言 bert1提出來後打開了遷移學習的大門，首先通過無監督的語料訓練通用的語言模型，然後基於自己的語料微調(finetune)模型來達到不同的業務需求。我們知道bert可以支持的最大token長度爲512，如果最大長度超過512，該怎麼樣處理呢？下面這邊論文提供一種簡單有效的解決思路。 Simple Applications of BERT for Ad Hoc Document Retriev

>>阅读原文<<