【天然語言處理】2.漢語語言學研究

簡介

漢語屬於漢藏語系,與世界各國普遍使用的拼音文字相比,他更像一種古老的孤立語。學習

這是中華民族獨特的地理位置和長期統一的發展歷程所決定的。ui

雖然,漢語在歷史上前後吸取和同化了匈奴、鮮卑、突厥、契丹、滿、蒙古、梵語等語言中的許多成分,可是兩千多年來,漢語特有的符號化表現形式卻一直沒有改變過。進程

一、文字符號的起源

只有瞭解歷史,才能正確地理解如今,準確的預見將來。get

由於文字土坯了語言的時空範圍,是凝固的語言,因此文字並不是從一開始就記錄人們語言中的全部內容,而是由選擇第記錄一些對人們生產、生活比較重要的部分。千百年來,隨着人們生產、生活不斷髮展,文字也在不斷髮展,而且促進了語言進一步的統一和規範。方法

這是人類語言發展的共同規律。總結

1.一、從記事談起

結繩記事、巖畫記事和刻契記事。這三類記事方式造成了後來文字符號的主要來源。規範化

  • 象形詞典:http://www.vividict.com/default.aspxdict

  • 《中國古文字的起源》 結繩計數,數字語言

  • 考古發現雖然某些漢字的形體與結繩有零星的關係,但結繩記事不是漢字的主要來源;di

  • 繪畫;東巴文;

  • 刻契記事替代結繩記事是一種書寫載體的革新,它使記事載體從一維發展到了二維;

  • 有證據代表,刻契記過後來直接發展出了兩河流域(底格里斯河和幼發拉底河流域)蘇美爾人使用的楔形文字。

1.二、古文字的造成

夏王朝。

文字是一種記錄語言的符號,原始的記錄必須脫離了任意繪形、任意理解的階段,產生一批具備約定的意義,具備固定讀音的單字,而且能夠開始進行語料積累的時候,才能算真的產生。

即文字的產生必須具有以下的三個特色:

  • 約定的意義
  • 基本固定的讀音
  • 基本一致的形式

形、音、義的三者一致性。

這就必須具有形、音、義三者一致性。必須對當時的季師傅好有一個再創造的過程,這個過程就是造字。

長時間集體累積和創做的產物,並在長時間的氏族擴張和衰亡的征戰中不斷傳承與毀滅。

兩種矛盾:

  • 文字與語言;
  • 文字與書寫者;

二、六書及其餘

後人在總結前人的造字方法時,最重要的成果就是六書。

象形、指事、會意、轉註、假借、形聲。

2.一、象形

「象形者,畫成其物,隨體詰詘(jie qu),日月是也。」

模仿和抽象。

其餘的造字都是以象形文字爲根,在此結構上作出某種變形。

2.二、指事

「指事者,視而可識,查而見意,上下是也。」

局部、總體。

2.三、會意

「會意者,比類合誼,以見指撝(hui,wei),武、信是也。」

兩個或兩個以上的度漢字,拼接。

2.四、形聲

「形聲者,以事爲名,取譬相成,江河是也。」

90%;

在形聲字以前,字形和字義是統一的,字形可以完整的表達語義,但從形聲字開始,這種狀況發生了變化。一部分表義的功能讓位於表音的偏聲旁,更便於將語言中表意的音節迅速構成文字。這使得文字在數量上發生了質的飛躍。同時,形聲造字法使字形與字義逐漸分離開來。這是漢字走向符號化的第一步。

2.五、轉註

轉註是原始文字規範化的開始,轉註暗示了這樣一個規則——語義上近似的兩個字,其字形也應該儘可能類似,其不一樣之處能夠經過其餘造字模式來彌補。

例如:「女」經過加入表示「因生育而發達的兩乳」的兩點,即指事造字法,構造出了新字「母」。

轉註法提出說明上文所述的4種造字法並不完整,表示同一語義的字可能有不少種。

殷商甲骨文:4500詞就支持了豐富的社會生活,這就是轉註造字法的做用。

2.六、假借

「假借者,本無其字,依聲託事,令長是也。」

假借法使用已有的漢字去記錄新詞,其進步的意義在於,減小了須要記憶的字符數量。這是假借的積極做用。

但也由於這樣致使了一字多意,客觀上形成了一些同音同形而異義的詞,令人不易掌握。

三、字形的流變

文字變革:隸變。

3.一、筆與墨的造成與變革

造成於商周,發展與秦漢。

3.二、隸變的方式

《試論漢字的隸變》

漢字的整體趨勢是一個由繁到簡的過程,這個趨勢在中國上下五千年的歷史彙總,從未改過。

3.三、漢字的符號化與結構

漢字新生了一種統一的子結構,就是咱們常說的部首。

漢字最先部件化的開始。

楷書的通行加速了漢字符號化的進程,而文字研究在隸變以後又一次達到了新的高潮。

偏旁部首纔是漢字構成的最小部分。

漢字結構

  • 簡介而不可分割
  • 上下結構
  • 左右結構
  • 半包圍結構
  • 全包圍結構
  • 堆成結構
  • 品字結構

咱們在記憶漢字時,首先大度記憶數量小得多的偏旁部首,再根據各個偏旁部首的位置和結構來記憶各類生僻的漢字,就會使漢字的學習變得容易多了,從而及大地下降了漢字的學習難度,即使如今看來也是一種極爲精妙的思惟。

在隋唐以後,漢語書面語逐漸向口語化的趨勢發展,後世稱爲近代百花。他的一個鮮明的特徵就是與口語相結合,出現了大量的複音詞和通俗的表達形式。此時,以獨字爲核心的古漢語又出現了新的發展。

相關文章
相關標籤/搜索