對於機器學習的理解,我相信不少人還沒法作到簡單、易懂的將其思想描述出來,好比這裏提到的一個基本概念:數據的維度,以及算法應用中爲什麼升維和降維。web
對於初學者來講,這些都是難以理解的,在前期可能只能套用固有的模型和算法進行機械化的「煉丹」,這時就會致使即便得出不錯的結果,但仍不知其因此然。算法
維度的詛咒shell
全都與孤獨有關微信
In a nutshell, the curse of dimensionality is all about loneliness.機器學習
咱們能夠經過下面這個小案例來理解下若將範式類的內容進行具象化、可視化並闡述,會對理解算法提供多大的幫助。
學習
維度越多,數據越稀疏人工智能
一維空間spa
想象一下,你坐在一個大教室裏,周圍被好友們包圍着。.net
二維空間設計
爲了給你更加溫馨的空間,咱們添加一個維度,在這個空間中,你和你的朋友更加分散。
三維空間
咱們繼續增長維度,忽然之間,您再也不被朋友所包圍,你感到有點寂寞。
四維空間
當咱們添加了時間的維度,你與朋友可貴碰到一次,因而,你在社交上與外界保持了足夠的距離。
若是你有足夠多的數據,增長維度便有利於區分開數據。
但反過來思考下,維度的不斷增多,對數據量的要求也會迅速增加,進而讓咱們不得不去尋找其餘辦法來輔助解決問題。
本文分享自微信公衆號 - 無界社區mixlab(mix-lab)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。