原由:不太經常使用網盤,今天蹲廁所前想拷個PDF到ipad上,用了女友的百度雲機器學習
過程1:偶然的發現,PC端上傳異常快,沒有等待的過程基本上(PDF大小137M),鄙人2M的渣帶寬,怎麼也得有個幾分鐘上傳的過程吧學習
過程2:ipad開始同步離線文件,直接就開始了下載,根本沒有等待的過程大數據
猜測:從過程1來看,顯然是雲端並沒接收個人PDF,PDF源文件是網上下的較流行的電子書,未作修改。想來是經過計算hash值或其餘方式指向雲端的已有資源ip
實驗:爲證明猜測1,將PDF與一私人文件打包,再次共享,果真在短暫停頓後,上傳開始資源
思考1:百度雲此舉顯然提高了用戶體驗,相同文件雲端直接下載,免去了等待上傳的時間;其次同一文件雲端存儲單一副本節約了雲端的空間資源同步
思考2:文件同步做爲百度雲的用戶行爲,能夠爲百度提供大量大數據和機器學習的基礎數據產品
思考3:經過對沒有分類或分類較單一的文件信息和用戶間的關係,可對雲端文件羣進行聚類分類處理,包括私有文件和公有文件的識別hash
思考4:一樣能夠從用戶的角度進行此項工做,從關係識別出用戶的喜愛特徵,從而進行推薦等工做基礎
思考5:再經過百度產品線間的數據共享,結合檢索歷史,音樂盒,移動應用信息等等。。。用戶體驗
呵呵呵
PS:若是未來推薦真的出來了,那傳幾個喜歡的島國動做片上去豈不是就至關於新番訂閱了:)