數據分析 第五篇:基於距離評估數據的相似性和相異性

聚類分析根據對象之間的相異程度,把對象分成多個簇,簇是數據對象的集合,聚類分析使得同一個簇中的對象相似,而與其他簇中的對象相異。相似性和相異性(dissimilarity)是根據數據對象的屬性值評估的,通常涉及到距離度量。相似性(similarity)和相異性(dissimilarity)是負相關的,統稱爲臨近性(proximity)。 在聚類分析中,聚類算法的第一步都是度量數據集對象之間的距離,
相關文章
相關標籤/搜索