基礎術語

數據集(data set):經驗數據記錄的集合

示例(instance)/樣本(sample):數據集中的每條記錄就是關於一個事件或對象的描述,稱爲一個示例或一個樣本

屬性(attribute)/特徵(feature):反映事件或對象在某方面的表現或性質的事項,稱爲屬性或特徵

屬性值(attribute value):屬性的值

屬性空間(attribute space)/樣本空間(sample space)/輸入空間(input space):
  屬性張成的空間,好比一個樣本有三個屬性A,B和C,則這三個屬性可做爲三個座標軸張成一個三維空間,每一個示例可看作三維空間中的一點

特徵向量(feature vector):屬性空間中每一個點對應一個座標向量,所以一個示例也稱爲一個特徵向量

有時,整個數據集也稱爲一個樣本,由於它看看作對樣本空間的一個採樣
需經過上下文判斷,樣本是指單個示例仍是數據集spa

相關文章
相關標籤/搜索