Hadoop的I/O操作(壓縮、序列化、基於文件的數據結構)

一、序列化 序列化就是把結構化對象,轉換成字節流序列或者其他數據傳輸協議以便於永久化存儲和網絡傳輸。反序列化是序列化的逆過程,即將收到的字節流序列、數據傳輸協議等,轉換成結構化的對象。Hadoop中用於多節點間進程通信的是RPC(遠程過程調用)。RPC序列化格式如下: 1、格式緊湊,節省資源,由於帶寬和存儲是數據中心中的最稀缺的資源,我們必須盡一切可能縮小傳遞信息的大小和存儲量,提高網絡帶寬利用率
相關文章
相關標籤/搜索