提起Hadoop文件系統,首先想到的是HDFS,HDFS是Hadoop主要的文件系統,Hadoop還集成了其餘文件系統。Hadoop的文件系統是一個抽象的概念,HDFS只是其中的一種實現,Java抽象類org.apache.hadoop.fs.FileSystem定義了Hadoop的一個文件系統接口,該抽象類有不一樣的具體實現,下面將逐個介紹。 apache
1 HDFS,Hadoop的分佈式文件系統。 安全
2 Local,使用了客戶端校驗和的本地磁盤文件系統。 服務器
3 HFTP,這是在HTTP上提供對於HSFS分佈式文件系統進行制度訪問的一個文件系統,注意該文件系統與FTP沒有關係,一般都是與distcp命令結合使用,能夠實如今不一樣版本的HDFS系統之間進行數據傳遞。(若是在兩個不一樣版本的HDFS系統之間用distcp複製數據,因爲兩個版本的RPC(Remote Procedure Call,遠程過程調用)是不兼容的,這樣就能夠利用基於只讀HTTP協議的HFTP文件系統從源文件系統中讀取數據。 tcp
4 HSFTP,在HTTPS(Hypertext Transfer Protocol over Secure Socket Layer,以安全爲目標的HTTP通道,簡單講是HTTP的安全版)上對HDFS提供製度訪問的文件系統。 分佈式
5 HAR,構建在其餘文件系統之上,主要用於文件存檔的文件系統,對HDFS中的文件進行歸檔,以減小NameNode的內存使用。 oop
6 HFS,相似於HDFS或者Google的GFS的文件系統,C++編寫。 spa
7 FTP,由FTP服務器支持的文件系統。 接口