3天然語言函數
3.1動物的語言學習
3.2天然語言blog
3.2.1英文語法考察遞歸
3.2.2中文語法考察遊戲
3.2.3喬姆斯基的語言觀基礎
3.4符號的組合軟件
規則語法
人類的嬰幼兒在開始學習說話一段時間後,就會不斷給父母帶來驚喜,幼兒會時不時說出父母未預料彷佛也未教過他的話語。小孩會在全部的環境中學習,積累必定的樣本後,小孩能夠從所學到的語句觸類旁通地組合出新的語句。幼兒對母語的學習顯示語言組合是有規則的,語言的習得就是能自由地運用這些規則組合出語句表述所想表達的意義。方法
規則是對組合機制的具體解讀。傳統語言學裏,英語的構詞法主要是指詞綴附加與內部變更,句法部分是按結構進行的配列:存在有哪些結構,每類結構有什麼位置,位置間能夠是什麼樣的順序,什麼語法實體可佔據什麼結構的什麼位置等等。這並非公認的解讀方式,如何解讀還是充滿爭議。對漢語來講,一些學者認爲:從初級語法實體到最後的語句,漢語都是按一樣的結構進行組合的。漢語的研究中,印歐語系語法描寫中哪些能夠借鑑,哪些不適用,從哪裏開始須要漢語本身的觀點與視角,這是個基本問題。im
不管什麼學派,今天對語言規則的總結都是不充分的。研究最多的語言——英語,在對計算機理解天然語言與生成天然語言語句的研究中,發現總結出的規則遠遠不夠,還需不斷補充。不是學者不夠努力,而是天然語言複雜且不規範,規則以外總有例外,細節性的規則也容易忽略。並且,天然語言是表義的系統,語言裏的組合會受到語義的牽引,天然語言在形式側面自己並不自足。
語言學家是從言語,即人們說出的話,或寫下的語句來總結語言的。天然語言的使用操做是在人腦中完成的,只在最後的展示步驟,才說出或寫出符號完成表達。從言語行爲所進行的外部描寫與總結,最多也只反映了人腦實際過程的部分因素。人腦的操做中,首先是積累,經過實際的樣本掌握語言的字、或詞、詞組等素材,熟悉各類組合應用的方式。潛移默化中大腦會對所接收到的樣本,包括素材、組合方法、使用情景等進行比較、劃分等分析整理工。好比素材會按任意一種意義上的類似造成記憶裏的聚類,能夠語義上的相關,也能夠是形式上的部分類似,或者在各種組合裏佔據相同的位置……,這也是索緒爾所講的「聯想關係」。符號組合的方式,索緒爾所說的句段關係,本書一樣認爲也是基於樣本的分析、整理,並以類比、聯想的方式應用的。如從組合的方式、組合應用的場景、使用目的、上下文環境、配列的單位、可類比或替換的方式等進行對比與劃分。下意識的分析整理造成了咱們對語言格局的語感與直覺,大腦首先是在基礎上工做。實際要進行表述時,咱們是匹配當前的被表述情景,聯想出候選的語言素材與方式,所獲得的語言素材與方式,支持起進一步的聯想,這種聯想能夠是習慣的不自覺的,也多是自覺的有創造性的,從發散聯想所獲得的候選項中作出選擇,選取本次表述所需用的素材與方式,所造成的表述也很容易類比延伸出其它的組合方式,最後所造成的表述多是刻板地忠於語法與被描述的現實,也能夠是基於可類比的一種表述,後者產生了語言中隱喻與各種修飾的手法。整個過程是以記憶、匹配、類比、聯想等爲基礎,而且是綜合了語法、語義、語用等這些被分開來講的因素。
語言上專門的學習與訓練,最可能是讓一個會奔跑的人發展成一名短跑、或長跑、或競走的運動員。考察中國人學習英語。在中國學校,學習外語很強調對語法的掌握,對英語的學習,每一個學生成年累月花費了巨大精力,最後平均的效果是多數人都不能應付平常的會話。
語言應用心智上的特徵,與前面說到的事實——對現實的描寫與對虛擬的描寫能夠一樣容易地由語法組合產生——結合,使得天然語言的應用,特別適合用於配合心智上類比、聯想、想象一類的發散性思惟。歷史地看,可能人類心智這一方向的能力,由於有了符號的出口而變得更活躍,甚至獲得進化。人類事前計劃的能力須要想象力,以及在合做的環境中對具體想象進行描述;現代人類的認知多從假設或約定前提開始,這也是想象達到,而且離不開符號的配合;更大範圍來考察,祭祀、神話、宗教等人類精神的這些側面,也是符號非寫實的應用,它們在語言的早期階段已出現。往壞的方向說,人類創造愈來愈多遠離實際。虛擬符號及符號的組合,本身也更常常地陷入不知所云中,語言變成了多種多樣的遊戲,撒謊也成爲了可能。
人類語言不是靜態的,而是在不停演化,其在時間某一截面上所呈現的規則性,本質上沒有物理學規律那樣的客觀與肯定性,就像其它的人類制度同樣,語言是帶有人類社羣主觀選擇的產物,所謂約定俗成,當目的、條件與環境改變,人類也會順應變化去改變本身的語言。
遞歸
這裏的遞歸是符號組合應用上的一個特徵,主要指結構上的嵌套使用,遞歸一詞在這裏的用法與在軟件裏的用法是不同,後者是指函數或過程在內部又調用了自身。咱們先舉個例子,好比說這一句:「今年山東產的新品種蘋果」,能夠分析爲(今年(山東產的(新品種(蘋果))))就是偏正結構的三次復加應用,第一次是(新品種(蘋果)),第二次是(山東產的(新品種蘋果)),第三次是(今年(山東產的新品種蘋果))。遞歸結果是大結構裏套着子結構,子結構裏套着孫結構……,父、子、孫的結構類型,所應用的規則能夠是同樣的,也能夠是不同的。遞歸的使用使得一樣的規則,有更強大的生成能力,同時遞歸也使「組合」一詞變得不恰當,更切合的詞彙是「複合」一詞。
重用
從前面的論述解讀出的另外一個重要概念是重用性。重用性意味着一個語法實體能夠重複地參與不一樣的、一般是更大的語法實體的組合,重複的次數不受限制。
語法實體的重用性隱含着語法實體的同一性要求:相同形式的語法實體使用中始終是同一單位,這是從語法實體的意義來講的,意義角度語法實體可視爲統一的總體。對漢語這樣的孤立語言來講,不會有理解上的障礙。對英語這樣存在形態變化的語言,事情就沒這麼明顯,同一詞根不一樣詞綴,或有過內部變換的詞看做同一詞,仍是區分爲不一樣的詞,是個有爭論的問題。另外,爲避免混亂須要把同一形式具備多種意義的語言單位區分爲不一樣的語法實體,好比一個多義詞看做是多個詞。即使如此,同一語法實體在不一樣的組合使用中咱們仍可感覺到其意義或功用上的細微差異,只是這種次一級的區別不影響總體上的統一性。
前面咱們說過,咱們從語言流中分析出語言的語法單位,正是從重用性來分析的。重用性自己也是塑造語言面貌的重要驅動力。在一個具體的表述中按須要咱們把二個單位A與B排列在一塊兒,後來發現其它的不少表述中A與B也被排列在一塊兒,那麼咱們會傾向於認爲AB是一固定的組合,並將其做爲一個語法實體,如做爲一個詞組,或做爲一個複合詞。擴散地,若是C的應用格局相似於A,D的應用格局相似於B,也可觀察到應用CD組合,那麼咱們可能嘗試將CD做爲相似於AB這樣固定語法實體的可能。反過來的過程也存在,若是AB的重用性太差,或語言總體風格上的轉向,AB做爲一個固定語法實體就可能被取消,還原爲A與B的臨時組合。
離散性與重用性不是對稱的,這裏的離散性是指那些不可拆分的語法實體,重用性能夠指這些語法實體,也可包括更上級組合,如習語。