Hadoop 數據類型

                      

            簡單點講,RPC框架就是能夠讓程序員來調用遠程進程上的代碼一套工具。有了RPC框架,咱程序員就輕鬆不少了,終於能夠逃離多線程、Socket、I/O的苦海了。java

            RPC, 遠程過程調用直觀說法就是A經過網絡調用B的過程方法。

通訊中的協議是你本身規定的,好比你能夠規定說當A向B發送數字1, B就打印hello world, 並返回數字1給A, 若是發送數字2,B就打印hello, guy.併發送數字2給A.            程序員

            序列化------------>寫  write(DataOutput out)網絡

                        反序列化-------->讀   readFields(DataInput in)
多線程

       一.  Hadoop內置的數據類型併發

  • BooleanWritable:標準布爾型數值框架

  • ByteWritable:單字節數值工具

  • DoubleWritable:雙字節數值oop

  • FloatWritable:浮點數this

  • IntWritable:整型數spa

  • LongWritable:長整型數

  • Text:使用UTF8格式存儲的文本

  • NullWritable:當<key, value>中的key或value爲空時使用

         Hadoop中的數據類型都要實現Writable接口,以便用這些類型定義的數據能夠被網絡傳輸和文件存儲。

                                    二. 用戶自定義數據類型的實現

     1.繼承接口Writable,實現其方法write()和readFields(), 以便該數據能被序列化後完成網絡傳輸或文件輸入/輸出;

     2.若是該數據須要做爲主鍵key使用,或須要比較數值大小時,則須要實現WritalbeComparable接口,實現其方法write(),readFields(),CompareTo() 。

     3.數據類型,必需要有一個無參的構造方法,爲了方便反射,進行建立對象。    

     4.在自定義數據類型中,建議使用java的原生數據類型,最好不要使用Hadoop對原生類型進行封裝的數據類型。eg.int x ;//IntWritable String s; //Text


 

public class Point3D implements WritableComparable<Point3D>

{

    private float x,y,z;

    public float getX(){return x;}

    public float getY(){return y;}

    public float getZ(){return z;}

    public Point3D (){}

    public void readFields(DataInput in) throws IOException

    {

        x = in.readFloat();

        y = in.readFloat();

        z = in.readFloat();

    }

    public void write(DataOutput out) throws IOException

    {

         out.writeFloat(x);

         out.writeFloat(y);

         out.writeFloat(z);

    }

 

    public int CompareTo(Point3D p)

    {

        //具體實現比較當前的空間座標點this(x,y,z)與指定的點p(x,y,z)的大小

        // 並輸出: -1(小於), 0(等於), 1(大於)

    }

}

相關文章
相關標籤/搜索