羞,Java 字符串拼接居然有這麼多姿式!

二哥,我今年大二,看你分享的《阿里巴巴 Java 開發手冊》上有一段內容說:「循環體內,拼接字符串最好使用 StringBuilder 的 append 方法,而不是 +號操做符。」到底爲何啊,我日常一直就用的‘+’號操做符啊!二哥有空的時候可否寫一篇文章分析一下呢?java

就在昨天,一位叫小菜的讀者微信我說了上面這段話。c++

我當時看到這條微信的第一感受是:小菜你也太菜了吧,這都不知道爲啥啊!我估計正在讀這篇文章的你也會有一樣的感受。程序員

但捫心自問,在我作程序員的前兩年內,我也不知道爲啥。遇到字符串拼接就上「+」號操做符,甭管是否是在循環體內。和小菜比起來,我當時可沒他這麼幸運,還有一位熱心的「二哥」可以分享這份價值連城的開發手冊。面試

既然我這麼熱心分享,不如好人作到底,對不對?我就認認真真地寫一篇文章,給小菜解惑一下。apache

0一、「+」號操做符

要說姿式,「+」號操做符必須是字符串拼接最經常使用的一種了,沒有之一。後端

String chenmo = "沉默";
String wanger = "王二";
System.out.println(chenmo + wanger);
複製代碼

咱們把這段代碼使用 JAD 反編譯一下。數組

String chenmo = "\u6C89\u9ED8"; // 沉默
String wanger = "\u738B\u4E8C"; // 王二
System.out.println((new StringBuilder(String.valueOf(chenmo))).append(wanger).toString());
複製代碼

我去,原來編譯的時候把「+」號操做符替換成了 StringBuilder 的 append方法。也就是說,「+」號操做符在拼接字符串的時候只是一種形式主義,讓開發者使用起來比較簡便,代碼看起來比較簡潔,讀起來比較順暢。算是 Java的一種語法糖吧。安全

0二、StringBuilder

除去「+」號操做符,StringBuilder 的 append 方法就是第二個經常使用的字符串拼接姿式了。bash

先來看一下 StringBuilder 類的 append 方法的源碼:微信

public StringBuilder append(String str) {
    super.append(str);
    return this;
}
複製代碼

這 3 行代碼沒啥可看的,可看的是父類 AbstractStringBuilder 的 append 方法:

public AbstractStringBuilder append(String str) {
    if (str == null) {
        return appendNull();
    }
    int len = str.length();
    ensureCapacityInternal(count + len);
    str.getChars(0, len, value, count);
    count += len;
    return this;
}
複製代碼

1)判斷拼接的字符串是否是 null,若是是,當作字符串「null」來處理。

appendNull 方法的源碼以下:

private AbstractStringBuilder appendNull() {
    int c = count;
    ensureCapacityInternal(c + 4);
    final char[] value = this.value;
    value[c++] = 'n';
    value[c++] = 'u';
    value[c++] = 'l';
    value[c++] = 'l';
    count = c;
    return this;
}
複製代碼

2)拼接後的字符數組長度是否超過當前值,若是超過,進行擴容並複製。

ensureCapacityInternal 方法的源碼以下:

private void ensureCapacityInternal(int minimumCapacity) {
    // overflow-conscious code
    if (minimumCapacity - value.length > 0) {
        value = Arrays.copyOf(value,
        newCapacity(minimumCapacity));
    }
}
複製代碼

3)將拼接的字符串 str 複製到目標數組 value 中。

str.getChars(0, len, value, count)
複製代碼

0三、StringBuffer

先有 StringBuffer 後有 StringBuilder,二者就像是孿生雙胞胎,該有的都有,只不過大哥 StringBuffer 由於多呼吸兩口新鮮空氣,因此是線程安全的。

public synchronized StringBuffer append(String str) {
    toStringCache = null;
    super.append(str);
    return this;
}
複製代碼

StringBuffer 類的 append 方法比 StringBuilder 多了一個關鍵字 synchronized,可暫時忽略 toStringCache = null。

synchronized 是 Java中的一個很是容易臉熟的關鍵字,是一種同步鎖。它修飾的方法被稱爲同步方法,是線程安全的。

0四、String 類的 concat 方法

單就姿式上來看,String 類的 concat 方法就好像 StringBuilder 類的 append。

String chenmo = "沉默";
String wanger = "王二";

System.out.println(chenmo.concat(wanger));
複製代碼

文章寫到這的時候,我忽然產生了一個奇妙的想法。假若有這樣兩行代碼:

chenmo += wanger
chenmo = chenmo.concat(wanger)
複製代碼

它們之間究竟有多大的差異呢?

以前咱們已經瞭解到,chenmo += wanger 實際上至關於 (new StringBuilder(String.valueOf(chenmo))).append(wanger).toString()。

要探究「+」號操做符和 concat 之間的差異,實際上要看 append 方法和 concat 方法之間的差異。

append 方法的源碼以前分析過了。咱們就來看一下 concat 方法的源碼吧。

public String concat(String str) {
    int otherLen = str.length();
    if (otherLen == 0) {
       return this;
    }
    int len = value.length;
    char buf[] = Arrays.copyOf(value, len + otherLen);
    str.getChars(buf, len);
    return new String(buf, true);
}
複製代碼

1)若是拼接的字符串的長度爲 0,那麼返回拼接前的字符串。

if (otherLen == 0) {
    return this;
}
複製代碼

2)將原字符串的字符數組 value 複製到變量 buf 數組中。

char buf[] = Arrays.copyOf(value, len + otherLen);
複製代碼

3)把拼接的字符串 str 複製到字符數組 buf 中,並返回新的字符串對象。

str.getChars(buf, len);
return new String(buf, true);
複製代碼

經過源碼分析咱們大體能夠得出如下結論:

1)若是拼接的字符串是 null,concat 時候就會拋出 NullPointerException,「+」號操做符會當作是「null」字符串來處理。

2)若是拼接的字符串是一個空字符串(""),那麼 concat 的效率要更高一點。畢竟不須要 new StringBuilder 對象。

3)若是拼接的字符串很是多,concat 的效率就會降低,由於建立的字符串對象越多,開銷就越大。

注意了!!!

弱弱地問一下啊,還有在用 JSP 的同窗嗎?EL 表達式中是不容許使用「+」操做符來拼接字符串的,這時候就只能用 concat 了。

${chenmo.concat('-').concat(wanger)}
複製代碼

0五、String 類的 join 方法

JDK 1.8 提供了一種新的字符串拼接姿式:String 類增長了一個靜態方法 join。

String chenmo = "沉默";
String wanger = "王二";
String cmower = String.join("", chenmo, wanger);
System.out.println(cmower);
複製代碼

第一個參數爲字符串鏈接符,好比說:

String message = String.join("-", "王二", "太特麼", "有趣了");
複製代碼

輸出結果爲:王二-太特麼-有趣了

咱們來看一下 join 方法的源碼:

public static String join(CharSequence delimiter, CharSequence... elements) {
    Objects.requireNonNull(delimiter);
    Objects.requireNonNull(elements);
    // Number of elements not likely worth Arrays.stream overhead.
    StringJoiner joiner = new StringJoiner(delimiter);
    for (CharSequence cs: elements) {
        joiner.add(cs);
    }
    return joiner.toString();
}
複製代碼

發現了一個新類 StringJoiner,類名看起來很 6,讀起來也很順口。StringJoiner 是 java.util 包中的一個類,用於構造一個由分隔符從新鏈接的字符序列。限於篇幅,本文就再也不作過多介紹了,感興趣的同窗能夠去了解一下。

0六、StringUtils.join

實戰項目當中,咱們處理字符串的時候,常常會用到這個類——org.apache.commons.lang3.StringUtils,該類的 join 方法是字符串拼接的一種新姿式。

String chenmo = "沉默";
String wanger = "王二";

StringUtils.join(chenmo, wanger);
複製代碼

該方法更善於拼接數組中的字符串,而且不用擔憂 NullPointerException。

StringUtils.join(null) = null
StringUtils.join([]) = ""
StringUtils.join([null]) = ""
StringUtils.join(["a", "b", "c"]) = "abc"
StringUtils.join([null, "", "a"]) = "a"
複製代碼

經過查看源碼咱們能夠發現,其內部使用的仍然是 StringBuilder。

public static String join(final Object[] array, String separator, final int startIndex, final int endIndex) {
    if (array == null) {
        return null;
    }
    if (separator == null) {
        separator = EMPTY;
    }

    final StringBuilder buf = new StringBuilder(noOfItems * 16);

    for (int i = startIndex; i < endIndex; i++) {
        if (i > startIndex) {
            buf.append(separator);
        }
        if (array[i] != null) {
            buf.append(array[i]);
        }
    }
    return buf.toString();
}
複製代碼

你們讀到這,不約而同會有這樣一種感受:我靠(音要拖長),沒想到啊沒想到,字符串拼接足足有 6 種姿式啊,晚上回到家必定要一一嘗試下。

0七、給小菜一個答覆

我相信,小菜讀到我這篇文章的時候,他必定會明白爲何阿里巴巴不建議在 for 循環中使用」+」號操做符進行字符串拼接了。

來看兩段代碼。

第一段,for 循環中使用」+」號操做符。

String result = "";
for (int i = 0; i < 100000; i++) {
    result += "六六六";
}
複製代碼

第二段,for 循環中使用 append。

StringBuilder sb = new StringBuilder();
for (int i = 0; i < 100000; i++) {
    sb.append("六六六");
}
複製代碼

這兩段代碼分別會耗時多長時間呢?在個人 iMac 上測試出的結果是:

1)第一段代碼執行完的時間爲 6212 毫秒

2)第二段代碼執行完的時間爲 1 毫秒

差距也太特麼大了吧!爲何呢?

我相信有很多同窗已經有了本身的答案:第一段的 for 循環中建立了大量的 StringBuilder 對象,而第二段代碼至始至終只有一個 StringBuilder 對象。

版權聲明:本文爲CSDN博主「沉默王二」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處連接及本聲明。
原文連接:https://blog.csdn.net/qing_gee/article/details/103060599
複製代碼

熱門內容:

一、歷史文章分類導讀列表!精選優秀博文都在這裏了!》

二、優化後的 Spring Boot 啓動究竟能有多快?

三、Spring 常犯的十大錯誤,這坑你踩過嗎?

四、不說「分佈式事務」理論,直接上大廠解決方案,絕對實用!

五、阿里巴巴程序員經常使用的 15 款開發者工具!你知道幾個?

六、七個開源的 Spring Boot 先後端分離項目,必定要收藏!

七、用 Git 和 Github 提升效率的 10 個技巧!

八、警戒,MyBatis的size()方法居然有坑!

九、面試官:線程順序執行,這麼多答案你都答不上來?

十、手把手教你重構亂糟糟的代碼

【視頻福利】2T免費學習視頻,搜索或掃描上述二維碼關注微信公衆號:Java後端技術(ID: JavaITWork),和20萬人一塊兒學Java!回覆:1024,便可免費獲取!內含SSM、Spring全家桶、微服務、MySQL、MyCat、集羣、分佈式、中間件、Linux、網絡、多線程,Jenkins、Nexus、Docker、ELK等等免費學習視頻,持續更新!

相關文章
相關標籤/搜索