基於XGBoost的句子相似度匹配

  問題的定義 項目概述 本項目將會是自然語言處理相關方法的實踐,數據集是Kaggle上關於句子相似度匹配的競賽。涉及到文本類信息的數據清洗和特徵工程,在模型方法上將會使用XGBoost。XGBosst方法是一類集成方法,將多個弱分類器集成爲一個強大的模型。鑑於本次項目競賽已經結束,所以最終的訓練效果無從驗證,本項目重點討論文本特徵的提取和XGBoost模型如何使用及調參。 問題陳述 本項目是一個
相關文章
相關標籤/搜索