先來看一個網上的題目:
在網絡傳輸數據時,常常須要將二進制數據轉換爲一個可打印字符串。通常用到的可打印字符集合包含64個字符,所以又稱爲Base64表示法。現有一個char數組長度爲12,要將它表示爲Base64字符串,請問Base64字符串最少須要____個char;若是char數組長度爲20,則須要____個char。
咱們把問題從後往前看,先來看看什麼是ASCII碼。web
如下內容摘自百度百科數組
ASCII ((American Standard Code for Information Interchange): 美國信息交換標準代碼)是基於 拉丁字母的一套電腦 編碼系統,主要用於顯示現代 英語和其餘 西歐語言。它是最通用的信息交換標準,並等同於 國際標準ISO/IEC 646。
它是一個標準,一個規定了計算系統中經常使用的一些字符的二進制值的標準。ASCII碼錶一共有128位,其對應的ASCII碼錶見後文。網絡
因此,ASCII碼錶中32~126一共95個字符都是可打印的字符。也就是在網絡中能夠傳輸的字符。這就解決了什麼是可打印字符的問題。工具
熟悉web開發的人員大底都知道,HTTP報文是由一行一行的簡單字符串組成的。HTTP報文都是純文本,不是二進制代碼。因此你也可能看到過關於說爲何HTTP協議傳輸不使用二進制,而使用文本進行傳輸的抱怨。ui
另外,咱們經過HTTP傳輸數據,在HTTP1.1版本中是能夠傳遞二進制數據的。那在HTTP0.9或者是隻支持ASCII文本傳輸的協議中(SMTP/POP3),咱們如何傳輸二進制流的數據呢?這就須要用到相應的轉碼方式來對二進制數據進行轉碼並傳輸。其中Base64就是一種。編碼
Base64是網絡上最多見的用於傳輸8Bit 字節碼的編碼方式之一,Base64就是一種基於64個可打印字符來表示 二進制數據的方法。可查看RFC2045~RFC2049,上面有MIME的詳細規範。
Base64編碼是從二進制到字符的過程,可用於在 HTTP環境下傳遞較長的標識信息
參見Base64對照表,咱們須要使用基本的64個字符來表示二進制數據,每一個字符都有對應的索引,最大的索引值爲63。63的二進制表示值爲:00111111,能夠用6個bit就能表示。因此若是咱們使用這些字符的索引值的二進制來推導出通常的8bit二進制碼,便可用來表示想要編碼的值了。 spa
轉換規則:code
這麼說可能比較空泛,拿我名稱的首字母縮寫lsy
作示例:orm
lsy
的ASCII碼二進制表示:01101100 01110011 01111001若是要編碼的值是一個十進制的1呢:索引
咱們能夠拿到這個結果值,到相應的Base64轉碼工具中查看,不出意外應該是同樣的。
那回到一開始的那個題目。你會計算了嗎?
其中char
類型佔1字節,就是8位,所能存儲的正整數是 0111 1111,即127
Bin(二進制) | Oct(八進制) | Dec(十進制) | Hex(十六進制) | 縮寫/字符 | 解釋 |
---|---|---|---|---|---|
0000 0000 | 00 | 0 | 0x00 | NUL(null) | 空字符 |
0000 0001 | 01 | 1 | 0x01 | SOH(start of headline) | 標題開始 |
0000 0010 | 02 | 2 | 0x02 | STX (start of text) | 正文開始 |
0000 0011 | 03 | 3 | 0x03 | ETX (end of text) | 正文結束 |
0000 0100 | 04 | 4 | 0x04 | EOT (end of transmission) | 傳輸結束 |
0000 0101 | 05 | 5 | 0x05 | ENQ (enquiry) | 請求 |
0000 0110 | 06 | 6 | 0x06 | ACK (acknowledge) | 收到通知 |
0000 0111 | 07 | 7 | 0x07 | BEL (bell) | 響鈴 |
0000 1000 | 010 | 8 | 0x08 | BS (backspace) | 退格 |
0000 1001 | 011 | 9 | 0x09 | HT (horizontal tab) | 水平製表符 |
0000 1010 | 012 | 10 | 0x0A | LF (NL line feed, new line) | 換行鍵 |
0000 1011 | 013 | 11 | 0x0B | VT (vertical tab) | 垂直製表符 |
0000 1100 | 014 | 12 | 0x0C | FF (NP form feed, new page) | 換頁鍵 |
0000 1101 | 015 | 13 | 0x0D | CR (carriage return) | 回車鍵 |
0000 1110 | 016 | 14 | 0x0E | SO (shift out) | 不用切換 |
0000 1111 | 017 | 15 | 0x0F | SI (shift in) | 啓用切換 |
0001 0000 | 020 | 16 | 0x10 | DLE (data link escape) | 數據鏈路轉義 |
0001 0001 | 021 | 17 | 0x11 | DC1 (device control 1) | 設備控制1 |
0001 0010 | 022 | 18 | 0x12 | DC2 (device control 2) | 設備控制2 |
0001 0011 | 023 | 19 | 0x13 | DC3 (device control 3) | 設備控制3 |
0001 0100 | 024 | 20 | 0x14 | DC4 (device control 4) | 設備控制4 |
0001 0101 | 025 | 21 | 0x15 | NAK (negative acknowledge) | 拒絕接收 |
0001 0110 | 026 | 22 | 0x16 | SYN (synchronous idle) | 同步空閒 |
0001 0111 | 027 | 23 | 0x17 | ETB (end of trans. block) | 結束傳輸塊 |
0001 1000 | 030 | 24 | 0x18 | CAN (cancel) | 取消 |
0001 1001 | 031 | 25 | 0x19 | EM (end of medium) | 媒介結束 |
0001 1010 | 032 | 26 | 0x1A | SUB (substitute) | 代替 |
0001 1011 | 033 | 27 | 0x1B | ESC (escape) | 換碼(溢出) |
0001 1100 | 034 | 28 | 0x1C | FS (file separator) | 文件分隔符 |
0001 1101 | 035 | 29 | 0x1D | GS (group separator) | 分組符 |
0001 1110 | 036 | 30 | 0x1E | RS (record separator) | 記錄分隔符 |
0001 1111 | 037 | 31 | 0x1F | US (unit separator) | 單元分隔符 |
0010 0000 | 040 | 32 | 0x20 | (space) | 空格 |
0010 0001 | 041 | 33 | 0x21 | ! | 歎號 |
0010 0010 | 042 | 34 | 0x22 | " | 雙引號 |
0010 0011 | 043 | 35 | 0x23 | # | 井號 |
0010 0100 | 044 | 36 | 0x24 | $ | 美圓符 |
0010 0101 | 045 | 37 | 0x25 | % | 百分號 |
0010 0110 | 046 | 38 | 0x26 | & | 和號 |
0010 0111 | 047 | 39 | 0x27 | ' | 閉單引號 |
0010 1000 | 050 | 40 | 0x28 | ( | 開括號 |
0010 1001 | 051 | 41 | 0x29 | ) | 閉括號 |
0010 1010 | 052 | 42 | 0x2A | * | 星號 |
0010 1011 | 053 | 43 | 0x2B | + | 加號 |
0010 1100 | 054 | 44 | 0x2C | , | 逗號 |
0010 1101 | 055 | 45 | 0x2D | - | 減號/破折號 |
0010 1110 | 056 | 46 | 0x2E | . | 句號 |
0010 1111 | 057 | 47 | 0x2F | / | 斜槓 |
0011 0000 | 060 | 48 | 0x30 | 0 | 字符0 |
0011 0001 | 061 | 49 | 0x31 | 1 | 字符1 |
0011 0010 | 062 | 50 | 0x32 | 2 | 字符2 |
0011 0011 | 063 | 51 | 0x33 | 3 | 字符3 |
0011 0100 | 064 | 52 | 0x34 | 4 | 字符4 |
0011 0101 | 065 | 53 | 0x35 | 5 | 字符5 |
0011 0110 | 066 | 54 | 0x36 | 6 | 字符6 |
0011 0111 | 067 | 55 | 0x37 | 7 | 字符7 |
0011 1000 | 070 | 56 | 0x38 | 8 | 字符8 |
0011 1001 | 071 | 57 | 0x39 | 9 | 字符9 |
0011 1010 | 072 | 58 | 0x3A | : | 冒號 |
0011 1011 | 073 | 59 | 0x3B | ; | 分號 |
0011 1100 | 074 | 60 | 0x3C | < | 小於 |
0011 1101 | 075 | 61 | 0x3D | = | 等號 |
0011 1110 | 076 | 62 | 0x3E | > | 大於 |
0011 1111 | 077 | 63 | 0x3F | ? | 問號 |
0100 0000 | 0100 | 64 | 0x40 | @ | 電子郵件符號 |
0100 0001 | 0101 | 65 | 0x41 | A | 大寫字母A |
0100 0010 | 0102 | 66 | 0x42 | B | 大寫字母B |
0100 0011 | 0103 | 67 | 0x43 | C | 大寫字母C |
0100 0100 | 0104 | 68 | 0x44 | D | 大寫字母D |
0100 0101 | 0105 | 69 | 0x45 | E | 大寫字母E |
0100 0110 | 0106 | 70 | 0x46 | F | 大寫字母F |
0100 0111 | 0107 | 71 | 0x47 | G | 大寫字母G |
0100 1000 | 0110 | 72 | 0x48 | H | 大寫字母H |
0100 1001 | 0111 | 73 | 0x49 | I | 大寫字母I |
0100 1010 | 0112 | 74 | 0x4A | J | 大寫字母J |
0100 1011 | 0113 | 75 | 0x4B | K | 大寫字母K |
0100 1100 | 0114 | 76 | 0x4C | L | 大寫字母L |
0100 1101 | 0115 | 77 | 0x4D | M | 大寫字母M |
0100 1110 | 0116 | 78 | 0x4E | N | 大寫字母N |
0100 1111 | 0117 | 79 | 0x4F | O | 大寫字母O |
0101 0000 | 0120 | 80 | 0x50 | P | 大寫字母P |
0101 0001 | 0121 | 81 | 0x51 | Q | 大寫字母Q |
0101 0010 | 0122 | 82 | 0x52 | R | 大寫字母R |
0101 0011 | 0123 | 83 | 0x53 | S | 大寫字母S |
0101 0100 | 0124 | 84 | 0x54 | T | 大寫字母T |
0101 0101 | 0125 | 85 | 0x55 | U | 大寫字母U |
0101 0110 | 0126 | 86 | 0x56 | V | 大寫字母V |
0101 0111 | 0127 | 87 | 0x57 | W | 大寫字母W |
0101 1000 | 0130 | 88 | 0x58 | X | 大寫字母X |
0101 1001 | 0131 | 89 | 0x59 | Y | 大寫字母Y |
0101 1010 | 0132 | 90 | 0x5A | Z | 大寫字母Z |
0101 1011 | 0133 | 91 | 0x5B | [ | 開方括號 |
0101 1100 | 0134 | 92 | 0x5C | \ | 反斜槓 |
0101 1101 | 0135 | 93 | 0x5D | ] | 閉方括號 |
0101 1110 | 0136 | 94 | 0x5E | ^ | 脫字符 |
0101 1111 | 0137 | 95 | 0x5F | _ | 下劃線 |
0110 0000 | 0140 | 96 | 0x60 | ` | 開單引號 |
0110 0001 | 0141 | 97 | 0x61 | a | 小寫字母a |
0110 0010 | 0142 | 98 | 0x62 | b | 小寫字母b |
0110 0011 | 0143 | 99 | 0x63 | c | 小寫字母c |
0110 0100 | 0144 | 100 | 0x64 | d | 小寫字母d |
0110 0101 | 0145 | 101 | 0x65 | e | 小寫字母e |
0110 0110 | 0146 | 102 | 0x66 | f | 小寫字母f |
0110 0111 | 0147 | 103 | 0x67 | g | 小寫字母g |
0110 1000 | 0150 | 104 | 0x68 | h | 小寫字母h |
0110 1001 | 0151 | 105 | 0x69 | i | 小寫字母i |
0110 1010 | 0152 | 106 | 0x6A | j | 小寫字母j |
0110 1011 | 0153 | 107 | 0x6B | k | 小寫字母k |
0110 1100 | 0154 | 108 | 0x6C | l | 小寫字母l |
0110 1101 | 0155 | 109 | 0x6D | m | 小寫字母m |
0110 1110 | 0156 | 110 | 0x6E | n | 小寫字母n |
0110 1111 | 0157 | 111 | 0x6F | o | 小寫字母o |
0111 0000 | 0160 | 112 | 0x70 | p | 小寫字母p |
0111 0001 | 0161 | 113 | 0x71 | q | 小寫字母q |
0111 0010 | 0162 | 114 | 0x72 | r | 小寫字母r |
0111 0011 | 0163 | 115 | 0x73 | s | 小寫字母s |
0111 0100 | 0164 | 116 | 0x74 | t | 小寫字母t |
0111 0101 | 0165 | 117 | 0x75 | u | 小寫字母u |
0111 0110 | 0166 | 118 | 0x76 | v | 小寫字母v |
0111 0111 | 0167 | 119 | 0x77 | w | 小寫字母w |
0111 1000 | 0170 | 120 | 0x78 | x | 小寫字母x |
0111 1001 | 0171 | 121 | 0x79 | y | 小寫字母y |
0111 1010 | 0172 | 122 | 0x7A | z | 小寫字母z |
0111 1011 | 0173 | 123 | 0x7B | { | 開花括號 |
0111 1100 | 0174 | 124 | 0x7C | | | 垂線 |
0111 1101 | 0175 | 125 | 0x7D | } | 閉花括號 |
0111 1110 | 0176 | 126 | 0x7E | ~ | 波浪號 |
0111 1111 | 0177 | 127 | 0x7F | DEL (delete) | 刪除 |
索引 | 對應字符 | 索引 | 對應字符 | 索引 | 對應字符 | 索引 | 對應字符 |
---|---|---|---|---|---|---|---|
0 | A | 17 | R | 34 | i | 51 | z |
1 | B | 18 | S | 35 | j | 52 | 0 |
2 | C | 19 | T | 36 | k | 53 | 1 |
3 | D | 20 | U | 37 | l | 54 | 2 |
4 | E | 21 | V | 38 | m | 55 | 3 |
5 | F | 22 | W | 39 | n | 56 | 4 |
6 | G | 23 | X | 40 | o | 57 | 5 |
7 | H | 24 | Y | 41 | p | 58 | 6 |
8 | I | 25 | Z | 42 | q | 59 | 7 |
9 | J | 26 | a | 43 | r | 60 | 8 |
10 | K | 27 | b | 44 | s | 61 | 9 |
11 | L | 28 | c | 45 | t | 62 | + |
12 | M | 29 | d | 46 | u | 63 | / |
13 | N | 30 | e | 47 | v | ||
14 | O | 31 | f | 48 | w | ||
15 | P | 32 | g | 49 | x | ||
16 | Q | 33 | h | 50 | y |
因爲一個char字符就佔一個byte,也就是8bit。因此原始字符二進制碼長度爲:12 * 8 = 96;由於原長度正好是3的倍數。轉換爲6bit的二進制長度: 96 / 6 = 16;若是長度爲20:20 * 8 / 6 除不盡,原長度不是3的倍數。因此要把原廠度補爲3的倍數。也就是21 * 8 / 6 = 28;