一種解決bert長文本匹配的方法

引言 bert1提出來後打開了遷移學習的大門,首先通過無監督的語料訓練通用的語言模型,然後基於自己的語料微調(finetune)模型來達到不同的業務需求。我們知道bert可以支持的最大token長度爲512,如果最大長度超過512,該怎麼樣處理呢?下面這邊論文提供一種簡單有效的解決思路。 Simple Applications of BERT for Ad Hoc Document Retriev
相關文章
相關標籤/搜索