AMiner平臺由清華大學計算機系研發,擁有我國徹底自主知識產權。平臺包含了超過2.3億學術論文/專利和1.36億學者的科技圖譜,提供學者評價、專家發現、智能指派、學術地圖等科技情報專業化服務。系統2006年上線,吸引了全球220個國家/地區1000多萬獨立IP訪問,數據下載量230萬次,年度訪問量超過1100萬,成爲學術搜索和社會網絡挖掘研究的重要數據和實驗平臺。web
機器學習算法的樣本複雜度(sample complexity)表示成功學習目標函數所需的訓練樣本數。更準確地說,樣本複雜度是開發者須要提供給算法的訓練樣本的數量,以使算法返回的函數在最佳函數的任意小偏差範圍內,而且機率任意接近1。樣本複雜度有兩種變體:弱變量固定特定的輸入-輸出分佈。強變量採用全部輸入-輸出分佈中最差狀況的樣本複雜性。算法
根據AMiner-NeurIPS 2020詞雲圖和論文能夠看出,與sample complexity是在本次會議中的熱點,下面咱們一塊兒看看sample complexity主題的相關論文。
微信
1.論文名稱:Planning in Markov Decision Processes with Gap-Dependent Sample Complexity網絡
論文連接:https://www.aminer.cn/pub/5ee3526a91e011cb3bff73ff?conf=neurips2020機器學習
簡介:咱們提出MDP-GapE,這是一種新的基於軌跡的蒙特卡洛樹搜索算法,用於在馬爾可夫決策過程當中進行規劃,其中對過渡具備有限的支持。 咱們證實了對MDP-GapE識別高几率接近最優動做所需的生成模型的調用次數的上限。 這個與問題相關的樣本複雜性結果用探索過程當中訪問的狀態-動做對的次優差距表示。 咱們的實驗代表,與其餘在固定置信度設置中具備樣本複雜性保證的算法相反,MDP-GapE在實踐中也頗有效,而這些算法大可能是理論上的。svg
2.論文名稱:Sample Complexity of Uniform Convergence for Multicalibration函數
論文連接:https://www.aminer.cn/pub/5eb3dc4191e011ce31f27f31?conf=neurips2020學習
簡介:人們愈來愈關注機器學習系統中的社會問題,尤爲是在公平方面。多重校準提供瞭解決組公平性的綜合方法。在這項工做中,咱們解決了多重校準偏差,並將其與預測偏差解耦。使公平性度量標準(多重校準)與準確性(預測偏差)脫鉤的重要性在於二者之間固有的權衡,以及有關「正確權衡」的社會決策(監管機構屢次強加)。咱們的工做爲多重校準偏差的統一收斂保證提供了樣本複雜性界限,這意味着不管準確度如何,咱們均可以保證經驗和(真實)多重校準偏差相近。咱們強調咱們的結果:(1)比之前的界限更籠統,由於它們適用於不可知論和可實現的設置,而且不依賴於特定類型的算法(例如遞歸私有),(2)比之前的多重校準更好樣本複雜度界限和(3)暗示了經典校準偏差的一致收斂保證。
測試
3.論文名稱:Estimating decision tree learnability with polylogarithmic sample complexity編碼
論文連接:https://www.aminer.cn/pub/5f7fdd328de39f0828397e8a?conf=neurips2020
簡介:咱們代表自上而下的決策樹學習啓發式方法適合於高效的可學習性估計:對於單調目標函數,這些啓發式方法構造的決策樹假設的偏差能夠經過多對數估計的多個帶標籤的示例進行估計,其指數小於運行這些啓發式方法,而且實際上比學習一個好的決策樹所需的信息理論最小值小得多。這增長了少許但不斷增加的基礎學習算法列表,這些算法已被證實適合於可學習性估計。在得出此結果的過程當中,咱們設計並分析了自上而下的決策樹學習啓發式方法的樣本有效迷你批處理版本,並代表它們得到了與完整批處理版本相同的可證實保證。咱們進一步給出這些啓發式的「活動本地」版本:給定一個測試點x^ star,咱們展現如何用多對數方法來計算決策樹假設T的標籤x^star許多帶有標籤的示例,其數量比學習T所需的數量小得多。
4.論文名稱:Sample complexity and effective dimension for regression on manifolds
論文連接:https://www.aminer.cn/pub/5ee8986891e011e66831c35b?conf=neurips2020
簡介:咱們考慮使用重現內核希爾伯特空間方法對流形進行迴歸的理論。 流形模型出如今各類各樣的現代機器學習問題中,咱們的目標是幫助理解利用流形結構的各類隱式和顯式降維方法的有效性。 咱們的第一個主要貢獻是根據微分幾何創建Weyl定律的一種新的非漸近形式。 因而可知,流形上的光滑函數的某些空間其實是有限維的,其複雜度根據流形維數而不是任何環境數據維來縮放。 最後,咱們顯示給定的(可能有噪聲的)函數值在流形上隨機地均勻地獲取,核迴歸估計量(從流形的頻譜分解中得出)產生由有效維數控制的偏差範圍。
5.論文名稱:Revisiting the Sample Complexity of Sparse Spectrum Approximation of Gaussian Processes
論文連接:https://www.aminer.cn/pub/5f7fdd328de39f0828397ec0?conf=neurips2020
簡介:咱們爲高斯過程引入了一種新的可伸縮近似,它具備可證實的保證,同時可在其整個參數空間上保持有效。 咱們的近似值是經過對稀疏頻譜高斯過程(SSGP)進行改進的樣本複雜度分析得到的。 特別是,咱們的分析代表,在必定的數據分解條件下,SSGP的預測和模型證據(用於訓練)能夠很好地近似具備較低樣本複雜度的完整GP的預測和模型證據。 咱們還開發了一種新的自動編碼算法,該算法可找到一個潛在空間,以將潛在輸入座標分解爲良好分隔的聚類,這適合咱們的樣本複雜度分析。 咱們在幾個基準上驗證了咱們提出的方法,併爲咱們的理論分析提供了有但願的結果。
根據主題分類查看更多論文,掃碼進入NeurIPS2020會議專題,最前沿的研究方向和最全面的論文數據等你來~
掃碼瞭解更多NeurIPS2020會議信息
添加「小脈」微信,留言「NeurIPS」,便可加入【NeurIPS會議交流羣】,與更多論文做者學習交流!
本文同步分享在 博客「AMiner科技」(CSDN)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。