玩轉人工智能(11)使用Pyspark上手機器學習

  文件系統         HDFS Hadoop Distributed File System,簡稱HDFS,是一個分佈式文件系統。HDFS是一個高度容錯性的系統,適合部署在廉價的機器上。HDFS能提供高吞吐量的數據訪問,非常適合大規模數據集上的應用。         GlusterFS 是一個集羣的文件系統,支持PB級的數據量。GlusterFS 通過RDMA和TCP/IP方式將分佈到不同
相關文章
相關標籤/搜索