1.1 試給出相應的版本空間。機器學習
首先有一個「假設空間」,現實問題中假設空間通常很大。而後有許多策略是能夠對假設空間進行搜索,搜索過程當中刪除與正例不一致的假設、和反例一致的假設。最後選出來的假設的集合,就叫作「版本空間」。性能
1.2 若使用最多包含k個合取式的析合範式來表達表1.1西瓜分類問題的假設空間,估算共有多少種可能的假設。學習
至少看到色澤有2種取值、根蒂有3種取值、敲聲有3種取值。可能的假設(「假設空間」的規模大小):3*4*4+1=49。設計
1.3 若數據包含噪聲,則假設空間中有不存在與全部訓練樣本都一致的假設。在此情形下,試設計一種概括偏好用於假設選擇。blog
有多個假設,從已有的訓練樣本,沒法斷定哪一個假設更好,可是咱們必需要產生一個模型。就須要用到「概括偏好」。更偏好「平滑」的曲線。互聯網
1.4* 不使用「分類錯誤率」而用新的性能度量來對分類器進行評估,試證實「沒有免費的午飯定理」仍成立。搜索
1.5 試述機器學習能在互聯網搜索的哪一個環節起什麼做用。im
用在搜索結果推薦。利用已有的某個用戶的歷史數據(如曾經搜索看過什麼結果、用戶設備信息等),猜想他可能對哪一條搜索結果感興趣。感興趣度應該是一系列的值,最後按照值的高度逆序排列。數據