leetcode65 valid number 正則表達式的運用

題目要求

Validate if a given string is numeric.

Some examples:
"0" => true
" 0.1 " => true
"abc" => false
"1 a" => false
"2e10" => true
Note: It is intended for the problem statement to be ambiguous. You should gather all requirements up front before implementing one.

寫一個算法 判斷輸入的字符串是不是數字。
這道題的需求給的較爲模糊,對於什麼是數字並無給出明確的定義。這裏我要給出幾個特殊的狀況來講明數字到底是什麼。面試

  1. 空值返回false
  2. 字符串先後的空白字符不影響字符串最終的結果
  3. 1.以及.1都是符合標準的小數,可是.不符合
  4. e的先後必須有數字,e前的數字能夠爲整數或是小數,e後的數字必須爲正/負整數/0

思路一:正則表達式

關於正則表達式的入門,請參考個人前不久寫的一篇博客。在尚未了解正則表達式的時候,我將數字分爲三種正則表達式

  1. 整數
  2. 小數
  3. 包含e

事實上啊,這是極爲不合理的一種分類,由於它們之間從數字構成的角度來講相互包含,在判斷時會形成代碼的冗餘。菜雞版本代碼以下:算法

public boolean isNumber(String s) {
        s = s.trim();
        if(s.contains("e")){
            String firstPart = s.substring(0, s.indexOf("e"));
            String secondPart = s.indexOf("e")+1 >= s.length() ? "" : s.substring(s.indexOf("e")+1);
            return (isInteger(firstPart) || isDouble(firstPart)) && isInteger(secondPart);
        }else if(s.contains(".")){
            return isDouble(s);
        }else{
            return isInteger(s);
        }
        
    }
    
    public boolean isDouble(String s){
        if(s.startsWith("-") || s.startsWith("+")){
            s = s.substring(1);
        }
        if(s.length() <= 1){
            return false;
        }
        return s.matches("^([0-9]*)?+\\.([0-9]*)$");
    }
    
    public boolean isInteger(String s){
        return s.matches("^(-|\\+)?([0-9]{1,})$");
    }

在稍微深刻的瞭解了正則表達式以後,我對於數字的判斷有了新的認識,將數字先劃分爲兩類:包含e以及不包含e。鑑於不管包含或是不包含e,e的前面都必須有數字。因此這時候再來分析e前數字的特性。e前數字能夠爲整數也能夠爲小數,但這裏涉及到小數點時,又要從新考慮,畢竟.不能夠單獨存在,可是隻要先後任何一個位置有數字,就能夠稱其爲小數。這是我決定將小數點後沒有數字的那一類字符串也劃分到整數的部分,也就簡化了個人正則表達式。完整的正則表達式爲^ *[+-]?(([0-9]+\\.?)|([0-9]*\\.[0-9]+))(e[+-]?[0-9]+)? *$
注意!正則表達式的開頭和結尾均有空格
代碼以下:express

public boolean isNumber2(String s){
        return s.matches("^ *[+-]?(([0-9]+\\.?)|([0-9]*\\.[0-9]+))(e[+-]?[0-9]+)? *$");
    }

思路二:flags

一個完美的正則表達式帶來的代碼雖然只有一行,可是它的效率通常啊,我也很無奈啊。這時我參考了一下高效大神的代碼。大神采用的思路就是利用各類flag結合字符串當前位置上的值來判斷該字符串是否合理。代碼以下:segmentfault

/**
     * We start with trimming.
     * If we see [0-9] we reset the number flags.
     * We can only see . if we didn't see e or ..
     * We can only see e if we didn't see e but we did see a number. We reset numberAfterE flag.
     * We can only see + and - in the beginning and after an e
     * any other character break the validation.
     * At the end it is only valid if there was at least 1 number and if we did see an e then a number after it as well.
     * So basically the number should match this regular expression:
     * [-+]?(([0-9]+(.[0-9]*)?)|.[0-9]+)(e[-+]?[0-9]+)?
     *
     *翻譯:
     *若是咱們看到數字,就將numberFlag設爲true
     *若是看到小數點,則判斷是否已有小數點或是e,由於e後只能有整數
     *e只能遇到一次,若是第一次遇到e可是沒有遇到數字,則返回錯誤。遇到第一個e後,將numberAfterE flag標註爲否以便判斷後序是否有數字
     *正負號的位置只能位於最開始和e緊鄰着右邊那個位置
     */
    public boolean isNumber3(String s){
        s = s.trim();
        boolean pointSeen = false;
        boolean eSeen = false;
        boolean numberSeen = false;
        boolean numberAfterE = true;
        for(int i=0; i<s.length(); i++) {
            //當前值爲數字
            if('0' <= s.charAt(i) && s.charAt(i) <= '9') {
                numberSeen = true;
                numberAfterE = true;
            //遇到小數點
            } else if(s.charAt(i) == '.') {
                //已經遇到小數點或是e,則出錯
                if(eSeen || pointSeen) {
                    return false;
                }
                pointSeen = true;
            //遇到e
            } else if(s.charAt(i) == 'e') {
                //已經遇到e或是還沒有遇到數字
                if(eSeen || !numberSeen) {
                    return false;
                }
                numberAfterE = false;
                eSeen = true;
            //遇到正負號,只能在首位或是e後面
            } else if(s.charAt(i) == '-' || s.charAt(i) == '+') {
                if(i != 0 && s.charAt(i-1) != 'e') {
                    return false;
                }
            //遇到其它符號必定是錯的
            } else {
                return false;
            }
        }   
        //是否遇到小數點或是e均不重要
        return numberSeen && numberAfterE;
    }

這裏運用的flags的方法其實很是考驗對需求的有效分類,尤爲是對字符串中存在e的狀況的判斷。這種方式使用O(n)的時間複雜度實現判斷。而在遇到存疑狀況時,每每比正常的正則表達式更有效。
clipboard.png
想要了解更多開發技術,面試教程以及互聯網公司內推,歡迎關注個人微信公衆號!將會不按期的發放福利哦~微信

相關文章
相關標籤/搜索