- 語料庫:對語言進行全景性的透視。
- 語料庫思想產生的背景:
- 電腦科技的發展,信息技術的支持;
- 從現象概括原理的思考模式
- 語料庫幾個特徵
- 語料庫必定是機讀的,不是爲人準備的,由於其統計很是的繁雜,分析很是的繁雜;
- 必須是確認爲真的,進入語料庫的語言必須是通過挑選、篩選的
- 是一個有限集合,是一個語言的抽樣
- 表明性和要研究的目的是緊密相關的
- 狹義的語料庫只有文字,廣義的語料庫還有聲音、視頻、手語等多模態語料庫
-
語料庫建設的基本問題。
-
語料一旦肯定,不多更新
-
人工參與過多,自動化程度不高
-
缺少語言資源管理(缺少網站式的管理工具)
-
缺少用戶定製功能
-
成本大,週期長
-
語料庫建設網絡化(更多的人一塊兒建設)
- 語料庫類型
-
可比語料庫(最簡單),由討論一個領域的兩種語料組成。舉例:奧運會翻譯的時候作排球賽事的翻譯,首先要找討論排球的英文文章和中文文章,創建可比語料庫。
-
平行語料庫,對其的文本。篇章對其、段落對其、句對其、亞句對其、詞對其。句對其很重要,句對其的語料庫能夠做爲翻譯記憶存在。
-
單語語料庫,語料庫只有一種語言,外語單語語料庫庫,藉助於語料檢索與統計分析工具,能夠獲得遠超詞典和語法書的語用知識。(免費、量大、質高、檢索方便、對翻譯實務可用性較強)
-
-
-
翻譯學者語料庫,統計口語錯誤、書面錯誤,用於對學習過程的分析的語料庫
-
-
-
獲取專業知識、學習專業術語、借鑑表達方法、模仿寫做風格、提供翻譯策略
-
幫助譯者理解原文、幫助譯者尋找更合適的表達方法
語料庫學習視頻下載地址:連接:https://pan.baidu.com/s/1XBCCG0cS963cY1wZAU2aDQ 密碼:ew3yweb
論文學習資料下載地址:連接:https://pan.baidu.com/s/1AHt37NLRQSBfHuNPP-bjBg 密碼:ut9b網絡