數學、文字和天然語言同樣,都是信息的載體,他們之間有着自然的聯繫。語言和數學的產生都是爲了同同樣目的——記錄和傳播信息。本文是《數學之美》第一章札記。 安全
1798年,拿破崙遠征軍中,皮埃爾●弗朗索瓦●布沙爾中尉在一個叫羅塞塔的地方發現了一塊破碎的古埃及石碑,上面有三種語言:埃及象形文字、埃及的拼音文字和古希臘文,這就是著名的羅塞塔(Rosetta)石碑。
編碼
1822年,法國語言學家商博良破解了羅塞塔石碑上的古埃及象形文字。隨着羅塞塔石碑的破譯,幫助咱們瞭解了整個古埃及的歷史和文明,這要歸功於埃及人經過三種語言進行了記錄,這件事有兩點指導意義:spa
信息的冗餘是信息安全的保障。羅塞塔石碑上的內容是同一信息重複三次,所以只要有一分內容無缺保留下來,原有的信息就不會丟失,這對信道編碼有指導意義。翻譯
語言的數據,即語料,尤爲是雙語或者多語的對照語料對翻譯相當重要,它是咱們從事機器翻譯研究的基礎。orm
計數系統的產生軼聞:美籍俄裔物理學家喬治● 伽莫夫在《從一到無窮大》一書中講了這樣一個原始部落中的故事。兩個酋長要比一比誰說的數字大,一個酋長想了想,先說了「三」,第二個酋長想了半天,說你 贏了。由於在原始部落,物質極其缺少,超過三的時候不多,他們稱之爲「許多」或者叫數不清。當咱們的祖先須要記錄的物件超過三時,當他們以爲五和八仍是有 區別的時候,計數系統就產生了。數學
數字是計數系統的基礎。早起的數字並無書寫的形式,而是掰指頭,這就是咱們今天使用十進制的緣由。毫無疑問,若是咱們有十二個指頭,今天咱們用的必定是 十二進制。漸漸的,咱們的祖先發現十個指頭不夠用了。雖然最簡單的辦法就是把十個腳趾頭也算上,可是這不能解決根本問題。基礎
咱們的祖先發明瞭進位制,也就是今天所說的逢十進一。這是人類在科學上的重大飛躍。幾乎全部的文明都採用了十進制,但瑪雅文明除外,他們數完了所有的手指 和腳趾纔開始進位,也就是使用了二十進制。瑪雅人的一個世紀,他們稱爲太陽紀,是四百年。2012年正好是目前這個太陽紀的最後一年,2013年將是新的 太陽紀的開始,這也就是所謂的2012世界末日。原理
對於不一樣位數數字的表示,中國人和羅馬人都用明確的單位來表示數字的不一樣量級,中國人用個十百千萬億兆。羅馬人用Ⅰ表明個,Ⅴ表明5,Ⅹ表明10,L表明50, C表明100, D表明500, M表明1000。二進制
這兩種表示法都不自覺的引入了樸素的編碼的概念。首先,他們都是用不一樣的符號表明不一樣的數學概念;第二,他們分別制定瞭解碼的規則,在中國,解碼的規則是 乘法,在羅馬,解碼的規則是加減法——小數字出如今大數字左邊爲減,右邊爲加。從編碼的有效性來說,中國人的作法幣羅馬人高明。信息安全
描述數字最有效的是古印度人,他們發明了包括0在內的10個阿拉伯數字,這種表示方法比中國和羅馬的都抽象,可是使用方便,它們由阿拉伯人傳入歐洲並獲得普及。
古猶太人在要求抄寫《聖經》時,爲了不抄寫錯誤,發明了一種相似於咱們今天計算機和通訊中校驗碼的方法。他們把沒一個希伯來字母對應於一個數字,這樣每 行文字加起來便獲得一個特殊的數字,這個數字便成爲了這一行的校驗碼。一樣,對於每一列也是這樣處理。當猶太學者抄完一頁《聖經》時,他們須要把每一行的 文字加起來,看看新的校驗碼是否和原文的相同,而後對每一頁進行一樣的處理。這背後的原理和咱們今天的各類校驗是相同的。