import java.io.ByteArrayOutputStream;java
import java.io.FileInputStream;apache
import java.io.FileOutputStream;分佈式
import java.io.InputStream;ide
import java.net.URL;oop
import org.apache.hadoop.conf.Configuration;spa
import org.apache.hadoop.fs.FSDataInputStream;.net
import org.apache.hadoop.fs.FSDataOutputStream;xml
import org.apache.hadoop.fs.FileSystem;對象
import org.apache.hadoop.fs.FsUrlStreamHandlerFactory;接口
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;
import org.junit.Test;
public class seek {
/**
* 經過API實現seek操做
*
* @author Administrator
*
* [hadoop@hadoop01 ~]$ hdfs dfs -chmod -R a+w /user/hadoop
* [hadoop@hadoop01 ~]$ hdfs dfs -ls -R /
*
*
*/
@Test
public void seekfile() throws Exception {
//建立configuration對象,有個默認的加載順序,先從core-default.xml,再到src目錄中的文件,這裏
//咱們給定了
Configuration conf = new Configuration();
//經過conf的configuration對象建立了該分佈式文件系統fs,默認若是不指定文件的話爲本地文件系統
FileSystem fs = FileSystem.get(conf);
//定義一個URL的字符串
String file = "hdfs://hadoop01:9000/user/hadoop/data2/kaola.jpg";
//經過一個URL的字符串構建一個path對象
Path path = new Path(file);
FSDataInputStream in = fs.open(path);
//流對拷
IOUtils.copyBytes(in, new FileOutputStream("E:/kaola1.jpg"), 1024, false);
//從新定位到文件起始點,只有FSDataInputStream纔有實現seek接口,FSDataOutputStream沒有
in.seek(0);
IOUtils.copyBytes(in, new FileOutputStream("E:/kaola2.jpg"), 1024, true);
}
}