雷林鵬分享:Lua 字符串

  字符串或串(String)是由數字、字母、下劃線組成的一串字符。安全

  Lua 語言中字符串可使用如下三種方式來表示:網絡

  單引號間的一串字符。函數

  雙引號間的一串字符。lua

  [[和]]間的一串字符。3d

  以上三種方式的字符串實例以下:code

  string1 = "Lua"orm

  print("\"字符串 1 是\"",string1)教程

  string2 = 'codercto.com'索引

  print("字符串 2 是",string2)字符串

  string3 = [["Lua 教程"]]

  print("字符串 3 是",string3)

  以上代碼執行輸出結果爲:

  "字符串 1 是" Lua

  字符串 2 是 codercto.com

  字符串 3 是 "Lua 教程"

  轉義字符用於表示不能直接顯示的字符,好比後退鍵,回車鍵,等。如在字符串轉換雙引號可使用 "\""。

  全部的轉義字符和所對應的意義:

  轉義字符意義ASCII碼值(十進制)

  \a響鈴(BEL)007

  \b退格(BS) ,將當前位置移到前一列008

  \f換頁(FF),將當前位置移到下頁開頭012

  \n換行(LF) ,將當前位置移到下一行開頭010

  \r回車(CR) ,將當前位置移到本行開頭013

  \t水平製表(HT) (跳到下一個TAB位置)009

  \v垂直製表(VT)011

  \\表明一個反斜線字符''\'092

  \'表明一個單引號(撇號)字符039

  \"表明一個雙引號字符034

  \0空字符(NULL)000

  \ddd1到3位八進制數所表明的任意字符三位八進制

  \xhh1到2位十六進制所表明的任意字符二位十六進制

  字符串操做

  Lua 提供了不少的方法來支持字符串的操做:

  序號方法 & 用途

  1string.upper(argument):

  字符串所有轉爲大寫字母。

  2string.lower(argument):

  字符串所有轉爲小寫字母。

  3string.gsub(mainString,findString,replaceString,num)

  在字符串中替換,mainString爲要替換的字符串, findString 爲被替換的字符,replaceString 要替換的字符,num 替換次數(能夠忽略,則所有替換),如:

  > string.gsub("aaaa","a","z",3);

  zzza 3

  4string.find (str, substr, [init, [end]])

  在一個指定的目標字符串中搜索指定的內容(第三個參數爲索引),返回其具體位置。不存在則返回 nil。

  > string.find("Hello Lua user", "Lua", 1)

  7 9

  5string.reverse(arg)

  字符串反轉

  > string.reverse("Lua")

  auL

  6string.format(...)

  返回一個相似printf的格式化字符串

  > string.format("the value is:%d",4)

  the value is:4

  7string.char(arg) 和 string.byte(arg[,int])

  char 將整型數字轉成字符並鏈接, byte 轉換字符爲整數值(能夠指定某個字符,默認第一個字符)。

  > string.char(97,98,99,100)

  abcd

  > string.byte("ABCD",4)

  68

  > string.byte("ABCD")

  65

  >

  8string.len(arg)

  計算字符串長度。

  string.len("abc")

  3

  9string.rep(string, n)

  返回字符串string的n個拷貝

  > string.rep("abcd",2)

  abcdabcd

  10..

  連接兩個字符串

  > print("www.codercto".."com")

  www.coderctocom

  11string.gmatch(str, pattern)

  回一個迭代器函數,每一次調用這個函數,返回一個在字符串 str 找到的下一個符合 pattern 描述的子串。若是參數 pattern 描述的字符串沒有找到,迭代函數返回nil。

  > for word in string.gmatch("Hello Lua user", "%a+") do print(word) end

  Hello

  Lua

  user

  12string.match(str, pattern, init)

  string.match()只尋找源字串str中的第一個配對. 參數init可選, 指定搜尋過程的起點, 默認爲1。

  在成功配對時, 函數將返回配對錶達式中的全部捕獲結果; 若是沒有設置捕獲標記, 則返回整個配對字符串. 當沒有成功的配對時, 返回nil。

  > = string.match("I have 2 questions for you.", "%d+ %a+")

  2 questions

  > = string.format("%d, %q", string.match("I have 2 questions for you.", "(%d+) (%a+)"))

  2, "questions"

  字符串大小寫轉換

  如下實例演示瞭如何對字符串大小寫進行轉換:

  string1 = "Lua";

  print(string.upper(string1))

  print(string.lower(string1))

  以上代碼執行結果爲:

  LUA

  lua

  字符串查找與反轉

  如下實例演示瞭如何對字符串進行查找與反轉操做:

  string = "Lua Tutorial"

  -- 查找字符串

  print(string.find(string,"Tutorial"))

  reversedString = string.reverse(string)

  print("新字符串爲",reversedString)

  以上代碼執行結果爲:

  5 12

  新字符串爲 lairotuT auL

  字符串格式化

  Lua 提供了 string.format() 函數來生成具備特定格式的字符串, 函數的第一個參數是格式 , 以後是對應格式中每一個代號的各類數據。

  因爲格式字符串的存在, 使得產生的長字符串可讀性大大提升了。這個函數的格式很像 C 語言中的 printf()。

  如下實例演示瞭如何對字符串進行格式化操做:

  格式字符串可能包含如下的轉義碼:

  %c - 接受一個數字, 並將其轉化爲ASCII碼錶中對應的字符

  %d, %i - 接受一個數字並將其轉化爲有符號的整數格式

  %o - 接受一個數字並將其轉化爲八進制數格式

  %u - 接受一個數字並將其轉化爲無符號整數格式

  %x - 接受一個數字並將其轉化爲十六進制數格式, 使用小寫字母

  %X - 接受一個數字並將其轉化爲十六進制數格式, 使用大寫字母

  %e - 接受一個數字並將其轉化爲科學記數法格式, 使用小寫字母e

  %E - 接受一個數字並將其轉化爲科學記數法格式, 使用大寫字母E

  %f - 接受一個數字並將其轉化爲浮點數格式

  %g(%G) - 接受一個數字並將其轉化爲%e(%E, 對應%G)及%f中較短的一種格式

  %q - 接受一個字符串並將其轉化爲可安全被Lua編譯器讀入的格式

  %s - 接受一個字符串並按照給定的參數格式化該字符串

  爲進一步細化格式, 能夠在%號後添加參數. 參數將以以下的順序讀入:

  (1) 符號: 一個+號表示其後的數字轉義符將讓正數顯示正號. 默認狀況下只有負數顯示符號.

  (2) 佔位符: 一個0, 在後面指定了字串寬度時佔位用. 不填時的默認佔位符是空格.

  (3) 對齊標識: 在指定了字串寬度時, 默認爲右對齊, 增長-號能夠改成左對齊.

  (4) 寬度數值

  (5) 小數位數/字串裁切: 在寬度數值後增長的小數部分n, 若後接f(浮點數轉義符, 如%6.3f)則設定該浮點數的小數只保留n位, 若後接s(字符串轉義符, 如%5.3s)則設定該字符串只顯示前n位.

  string1 = "Lua"

  string2 = "Tutorial"

  number1 = 10

  number2 = 20

  -- 基本字符串格式化

  print(string.format("基本格式化 %s %s",string1,string2))

  -- 日期格式化

  date = 2; month = 1; year = 2014

  print(string.format("日期格式化 %02d/%02d/%03d", date, month, year))

  -- 十進制格式化

  print(string.format("%.4f",1/3))

  以上代碼執行結果爲:

  基本格式化 Lua Tutorial

  日期格式化 02/01/2014

  0.3333

  其餘例子:

  string.format("%c", 83) 輸出S

  string.format("%+d", 17.0) 輸出+17

  string.format("%05d", 17) 輸出00017

  string.format("%o", 17) 輸出21

  string.format("%u", 3.14) 輸出3

  string.format("%x", 13) 輸出d

  string.format("%X", 13) 輸出D

  string.format("%e", 1000) 輸出1.000000e+03

  string.format("%E", 1000) 輸出1.000000E+03

  string.format("%6.3f", 13) 輸出13.000

  string.format("%q", "One\nTwo") 輸出"One\

  Two"

  string.format("%s", "monkey") 輸出monkey

  string.format("%10s", "monkey") 輸出 monkey

  string.format("%5.3s", "monkey") 輸出 mon

  字符與整數相互轉換

  如下實例演示了字符與整數相互轉換:

  -- 字符轉換

  -- 轉換第一個字符

  print(string.byte("Lua"))

  -- 轉換第三個字符

  print(string.byte("Lua",3))

  -- 轉換末尾第一個字符

  print(string.byte("Lua",-1))

  -- 第二個字符

  print(string.byte("Lua",2))

  -- 轉換末尾第二個字符

  print(string.byte("Lua",-2))

  -- 整數 ASCII 碼轉換爲字符

  print(string.char(97))

  以上代碼執行結果爲:

  76

  97

  97

  117

  117

  a

  其餘經常使用函數

  如下實例演示了其餘字符串操做,如計算字符串長度,字符串鏈接,字符串複製等:

  string1 = "www."

  string2 = "codercto"

  string3 = ".com"

  -- 使用 .. 進行字符串鏈接

  print("鏈接字符串",string1..string2..string3)

  -- 字符串長度

  print("字符串長度 ",string.len(string2))

  -- 字符串複製 2 次

  repeatedString = string.rep(string2,2)

  print(repeatedString)

  以上代碼執行結果爲:

  鏈接字符串 www.codercto.com

  字符串長度 6

  coderctocodercto

  匹配模式

  Lua 中的匹配模式直接用常規的字符串來描述。 它用於模式匹配函數 string.find, string.gmatch, string.gsub, string.match。

  你還能夠在模式串中使用字符類。

  字符類指能夠匹配一個特定字符集合內任何字符的模式項。好比,字符類%d匹配任意數字。因此你可使用模式串 '%d%d/%d%d/%d%d%d%d' 搜索 dd/mm/yyyy 格式的日期:

  s = "Deadline is 30/05/1999, firm"

  date = "%d%d/%d%d/%d%d%d%d"

  print(string.sub(s, string.find(s, date))) --> 30/05/1999

  下面的表列出了Lua支持的全部字符類:

  單個字符(除 ^$()%.[]*+-? 外): 與該字符自身配對

  .(點): 與任何字符配對

  %a: 與任何字母配對

  %c: 與任何控制符配對(例如\n)

  %d: 與任何數字配對

  %l: 與任何小寫字母配對

  %p: 與任何標點(punctuation)配對

  %s: 與空白字符配對

  %u: 與任何大寫字母配對

  %w: 與任何字母/數字配對

  %x: 與任何十六進制數配對

  %z: 與任何表明0的字符配對

  %x(此處x是非字母非數字字符): 與字符x配對. 主要用來處理表達式中有功能的字符(^$()%.[]*+-?)的配對問題, 例如%%與%配對

  [數個字符類]: 與任何[]中包含的字符類配對. 例如[%w_]與任何字母/數字, 或下劃線符號(_)配對

  [^數個字符類]: 與任何不包含在[]中的字符類配對. 例如[^%s]與任何非空白字符配對

  當上述的字符類用大寫書寫時, 表示與非此字符類的任何字符配對. 例如, %S表示與任何非空白字符配對.例如,'%A'非字母的字符:

  > print(string.gsub("hello, up-down!", "%A", "."))

  hello..up.down. 4

  數字4不是字符串結果的一部分,他是gsub返回的第二個結果,表明發生替換的次數。

  在模式匹配中有一些特殊字符,他們有特殊的意義,Lua中的特殊字符以下:

  ( ) . % + - * ? [ ^ $

  '%' 用做特殊字符的轉義字符,所以 '%.' 匹配點;'%%' 匹配字符 '%'。轉義字符 '%'不只能夠用來轉義特殊字符,還能夠用於全部的非字母的字符。

  模式條目能夠是:

  單個字符類匹配該類別中任意單個字符;

  單個字符類跟一個 '*', 將匹配零或多個該類的字符。 這個條目老是匹配儘量長的串;

  單個字符類跟一個 '+', 將匹配一或更多個該類的字符。 這個條目老是匹配儘量長的串;

  單個字符類跟一個 '-', 將匹配零或更多個該類的字符。 和 '*' 不一樣, 這個條目老是匹配儘量短的串;

  單個字符類跟一個 '?', 將匹配零或一個該類的字符。 只要有可能,它會匹配一個;

  %n, 這裏的 n 能夠從 1 到 9; 這個條目匹配一個等於 n 號捕獲物(後面有描述)的子串。

  %bxy, 這裏的 x 和 y 是兩個明確的字符; 這個條目匹配以 x 開始 y 結束, 且其中 x 和 y 保持 平衡 的字符串。 意思是,若是從左到右讀這個字符串,對每次讀到一個 x 就 +1 ,讀到一個 y 就 -1, 最終結束處的那個 y是第一個記數到 0 的 y。 舉個例子,條目 %b() 能夠匹配到括號平衡的表達式。

  %f[set], 指 邊境模式; 這個條目會匹配到一個位於 set 內某個字符以前的一個空串, 且這個位置的前一個字符不屬於 set 。 集合 set 的含義如前面所述。 匹配出的那個空串之開始和結束點的計算就當作該處有個字符 '\0' 同樣。

  模式:

  模式 指一個模式條目的序列。 在模式最前面加上符號 '^' 將錨定從字符串的開始處作匹配。 在模式最後面加上符號 '$' 將使匹配過程錨定到字符串的結尾。 若是 '^' 和 '$' 出如今其它位置,它們均沒有特殊含義,只表示自身。

  捕獲:

  模式能夠在內部用小括號括起一個子模式; 這些子模式被稱爲 捕獲物。 當匹配成功時,由 捕獲物 匹配到的字符串中的子串被保存起來用於將來的用途。 捕獲物以它們左括號的次序來編號。 例如,對於模式 "(a*(.)%w(%s*))" , 字符串中匹配到 "a*(.)%w(%s*)" 的部分保存在第一個捕獲物中 (所以是編號 1 ); 由 "." 匹配到的字符是 2 號捕獲物, 匹配到 "%s*" 的那部分是 3 號。

  做爲一個特例,空的捕獲 () 將捕獲到當前字符串的位置(它是一個數字)。 例如,若是將模式 "()aa()" 做用到字符串 "flaaap" 上,將產生兩個捕獲物: 3 和 5 。(編輯:雷林鵬 來源:網絡 侵刪)

相關文章
相關標籤/搜索