源程序的相似性判斷---初級版本(哈希表)

問題描述 對於兩個C++語言的源程序代碼,用哈希表的方法分別統計兩個程序中使用C++語言關鍵字的情況,並最終按定量的計算結果,得出兩份程序的相似性。 基本思路 建立C++語言關鍵字的哈希表,統計在每個源程序中C++關鍵字出現的頻度, 得到兩個向量X1和X2,通過計算向量X1和X2的相對距離來判斷兩個源程序的相似性。  例如:          關鍵字           Void  Int   F
相關文章
相關標籤/搜索