KNN分類

一、算法思想 1. 首先分別讀取訓練集和驗證集的csv文件數據,分別將數據傳到列表sample_list、validation_list,通過兩層循環建立無重複詞語列表word_list,分別構建訓練集和驗證集的one_hot矩陣,對每一行的句子的每一個詞語,找出詞語在word_list出現的下標,在one_hot矩陣相應的對應位置置爲1。 2. 採取不同的度量方式,分別有漢明距離、傑卡德距離、餘
相關文章
相關標籤/搜索