WWM之殤:那些被掩蓋的「##京」最後被我們用了嗎?

平安科技舉辦2020中國大學生保險數字科技挑戰賽的比賽在昨天落下帷幕,筆者在自然語言處理賽道的成績是全榜第四,在這裏做個比賽分享,記錄一下歷程。                          1.1 數據 比賽數據是經過加密的對話數據,如下圖。主辦方需要我們設計一個算法去識別客戶的對話意圖,也就是一個多分類問題,客戶意圖的類別高達56類,存在極大的樣本不均衡問題。 1.2 算法思路 主辦方的數
相關文章
相關標籤/搜索