【Software Clone】2014-IEEE-Towards a Big Data Curated Benchmark of Inter-Project Code Clones

Abstract 大數據的克隆檢測和搜索算法已經作爲嵌入在應用中的一部分. 本文推出一個代碼檢測基準.包含一些已知的真假克隆代碼.其中包括600萬條真克隆(包含type-1,type-2,type-3,type-4). S1   Introduction IJaDataset 2.0包含25,000個系統,365MLOC(Million Lines of Code).通過人工標記找出實現相似功能的
相關文章
相關標籤/搜索