算法學習筆記----Day25(機器學習導論)

今日學習 第一部分:大數據時代 一.大數據的4V特徵 數據量大; 數據種類多:結構化數據(mysql)、非結構化數據(圖像、音頻)、半結構化數據(xml、html); 速度快:數據的增長速度快、處理速度快; 價值密度低:價值高,數據總量大,需要機器學習算法解決問題。 二.大數據項目架構 數據採集層:ftp、socket方式 數據存儲層:HDFS 數據分析層:MR\Hive\Impala\Spark
相關文章
相關標籤/搜索