- 相關(guān)推薦
機(jī)器翻譯中漢語(yǔ)動(dòng)結(jié)式生成的過(guò)程和困難
1.引言
當(dāng)電子計(jì)算機(jī)1946年問(wèn)世的時(shí)候,人們就提出了機(jī)器翻譯的想法,并且在1954年進(jìn)行了第一次機(jī)器翻譯試驗(yàn)。然而與后來(lái)的各種語(yǔ)言信息處理研究和應(yīng)用(語(yǔ)言信息檢索、文本自動(dòng)分類、自動(dòng)文摘、信息提取等等)相比,機(jī)器翻譯卻是進(jìn)展最慢的。學(xué)者們傾其大半生精力、商家投入為數(shù)可觀的資金,經(jīng)歷五十多年不懈的研究和開(kāi)發(fā),得到的成果或者產(chǎn)品卻常常不能令人滿意。
原因是什么呢?從語(yǔ)言研究的角度來(lái)說(shuō),機(jī)器翻譯系統(tǒng)分析、理解和生成自然語(yǔ)言的能力都還不到位,處理不了的語(yǔ)言現(xiàn)象很多:有的是句子結(jié)構(gòu)層次弄錯(cuò)了,有的是結(jié)構(gòu)關(guān)系弄錯(cuò)了,有的是成分之間的語(yǔ)義關(guān)系弄錯(cuò)了,有的是詞義辨識(shí)錯(cuò)了,還有的錯(cuò)誤是源語(yǔ)和目標(biāo)語(yǔ)之間的對(duì)比差異造成的。下面是機(jī)器翻譯處理漢語(yǔ)動(dòng)結(jié)式不成功的幾個(gè)例子(來(lái)自三個(gè)機(jī)器翻譯系統(tǒng))。
先看生成的情況,機(jī)器翻譯目前還很難生成漢語(yǔ)的動(dòng)結(jié)式,所以我們很少在漢語(yǔ)譯文里見(jiàn)到含有動(dòng)結(jié)式的句子。對(duì)于下面這個(gè)英譯漢的例子,三個(gè)系統(tǒng)都不能翻譯成“他把地掃干凈了”:
He swept the floor clean. * 他干凈地掃地了。
* 他清掃清潔的地板。
* 他清掃地板干凈。
再看漢語(yǔ)動(dòng)結(jié)式翻譯成英語(yǔ)的例子,它們可以說(shuō)明目前機(jī)器翻譯系統(tǒng)分析和理解漢語(yǔ)動(dòng)結(jié)式的能力:
他踢壞了三雙鞋!*He plays three pairs of evil shoes.
*He kicked three pairs of shoes bad.
*Him kick spoil 3 pairs of shoes.
這段路把媽媽走累了。*The way make mother tired after the walk.
*This section of way was walked mother tired(ly).
*This road mother walk tired.
大家吃膩了剩菜。*Everybody has fedded up with the leftovers.
*That everybody ate greasy(ly)surplus vegetable.
*All eat,is loathe to leave vegetable.
下面我們只討論動(dòng)結(jié)式的生成問(wèn)題,其中不包括以下三種情況:1)補(bǔ)語(yǔ)用“得”字連接的;2)補(bǔ)語(yǔ)虛化的,如:“抓住”、“買著”、“看完”、“辦成”等;3)補(bǔ)語(yǔ)和動(dòng)結(jié)式的賓語(yǔ)有固定搭配關(guān)系的,如:“說(shuō)走了板”、“看愣了神”、“苦出了頭”等等。
2.機(jī)器翻譯中的動(dòng)結(jié)式問(wèn)題
為了說(shuō)明機(jī)器翻譯如何處理動(dòng)結(jié)式述語(yǔ)結(jié)構(gòu),我們需要先看看機(jī)器翻譯的過(guò)程。下圖說(shuō)明了機(jī)器翻譯的原理,也是機(jī)器翻譯的整個(gè)過(guò)程。
附圖
圖1 機(jī)器翻譯的過(guò)程
顯然,這是一個(gè)理想化的機(jī)器翻譯過(guò)程。從S到I再到T的過(guò)程是中介語(yǔ)言的翻譯策略,中介語(yǔ)言通常是某種獨(dú)立于源語(yǔ)和目標(biāo)語(yǔ)的邏輯表達(dá)式。如果是英譯漢,對(duì)英語(yǔ)的分析和理解要從表層深入到底層,得到描述句子意義的中介語(yǔ)言邏輯表達(dá)式。同樣地,漢語(yǔ)也要從底層到表層一步一步生成。分析時(shí)從表層到底層走得越深,生成時(shí)從底層回到表層的過(guò)程也就越復(fù)雜。因此,需要分別對(duì)這兩種語(yǔ)言的句法和語(yǔ)義系統(tǒng)作深入的研究。實(shí)際上目前大部分機(jī)器翻譯系統(tǒng)都作不到這個(gè)程度,常見(jiàn)的翻譯策略是直接法或轉(zhuǎn)換法,或直接和轉(zhuǎn)換相結(jié)合的混合方法。我們可以通過(guò)一個(gè)英譯漢的例子對(duì)直接法、轉(zhuǎn)換法和中介語(yǔ)言法這三種翻譯策略作一個(gè)比較:
You get good reception on your radio.(摘自某產(chǎn)品說(shuō)明書(shū))
譯句1 你得到好的接收在你的收音機(jī)上。
譯句2 你用你的收音機(jī)得到好的接收。
譯句3 你的收音機(jī)接收情況良好。
在機(jī)器翻譯系統(tǒng)中,用直接法可以得到譯句1;用基于句法的轉(zhuǎn)換法,再加上一些語(yǔ)義關(guān)系的分析,能得到譯句2;譯句3是基于理解的,用中介語(yǔ)言法有可能作到。顯然,前一節(jié)關(guān)于動(dòng)結(jié)式英譯漢和漢譯英的例子,都不是基于理解的翻譯。
動(dòng)結(jié)式的結(jié)構(gòu)形式簡(jiǎn)潔,語(yǔ)義關(guān)系復(fù)雜,在漢語(yǔ)里是很有特點(diǎn)的一種結(jié)構(gòu)。呂叔湘先生(1986)曾用它說(shuō)明漢語(yǔ)句法的靈活性。人們?cè)趶母鞣N角度論述動(dòng)結(jié)式述補(bǔ)結(jié)構(gòu)的時(shí)候,常常會(huì)提到它在對(duì)外漢語(yǔ)教學(xué)當(dāng)中是個(gè)難點(diǎn)。同樣,在機(jī)器翻譯中它也是個(gè)難題。在漢語(yǔ)翻譯成外語(yǔ)的系統(tǒng)里,難的是如何分析和理解動(dòng)結(jié)式述補(bǔ)結(jié)構(gòu)。在外語(yǔ)翻譯成漢語(yǔ)的系統(tǒng)里,難的是如何生成含有動(dòng)結(jié)式的句子。
我們?cè)谶@里只討論生成的情況。在這種情況下,源語(yǔ)(例如英語(yǔ))往往沒(méi)有相當(dāng)于漢語(yǔ)動(dòng)結(jié)式的結(jié)構(gòu)形式,也很難用轉(zhuǎn)換規(guī)則把英語(yǔ)的某些結(jié)構(gòu)形式與漢語(yǔ)動(dòng)結(jié)式聯(lián)系起來(lái)。所以除非用個(gè)別處理的辦法,采用直接法和轉(zhuǎn)換法翻譯策略的系統(tǒng)很難生成漢語(yǔ)的動(dòng)結(jié)式譯文。要讓系統(tǒng)有
生成動(dòng)結(jié)式的能力,就要按中介語(yǔ)言法的思路,增加分析的深度,理解源語(yǔ)句子要表達(dá)的意思(各個(gè)成分的概念意義、成分之間的關(guān)系意義,句子的句式意義,等等),然后根據(jù)意義表達(dá)的需要,選擇動(dòng)結(jié)式的一種結(jié)構(gòu)形式,再生成表層的句子。目前我們對(duì)漢語(yǔ)的研究還不足以支持這樣的生成過(guò)程。所以在現(xiàn)有的機(jī)器翻譯系統(tǒng)輸出的漢語(yǔ)譯文當(dāng)中,很難找到地道的含有動(dòng)結(jié)式述補(bǔ)結(jié)構(gòu)的句子。于是就有了下面的譯文:
He has made the question complicated.他已使問(wèn)題復(fù)雜化。(他把問(wèn)題搞復(fù)雜了。)
The children have had enough to eat.孩子們已吃了足夠。(孩子們吃飽了。)
這樣的譯文對(duì)機(jī)器翻譯來(lái)說(shuō)就算不錯(cuò)了,只是念起來(lái)有些別扭,有點(diǎn)“機(jī)器味兒”。
3.動(dòng)結(jié)式的生成過(guò)程
機(jī)器翻譯譯文生成的任務(wù)是從要表達(dá)的意義出發(fā),經(jīng)過(guò)選擇詞語(yǔ)、確定詞語(yǔ)間的語(yǔ)義關(guān)系、確定目標(biāo)語(yǔ)句子的句法結(jié)構(gòu)等步驟,最終輸出與源語(yǔ)言句子在意義上等價(jià)的表層字符串。對(duì)于動(dòng)結(jié)式的生成,有以下幾步:
。ㄒ唬┐_定要表達(dá)的意思 。ㄋ模┱险Z(yǔ)義結(jié)構(gòu)
(二)選擇詞語(yǔ)、分派語(yǔ)義角色。ㄎ澹┻x擇句法表現(xiàn)形式
。ㄈ┡袛嗪戏ㄐ浴 。┨幚肀韺釉~語(yǔ)
3.1 制定要表達(dá)的意思
漢語(yǔ)動(dòng)結(jié)式述語(yǔ)結(jié)構(gòu)表達(dá)的是一種“動(dòng)作—結(jié)果”事件。比如要生成的意思是:小王讀了這篇文章,結(jié)果小王懂了這篇文章。在漢語(yǔ)生成開(kāi)始之前,機(jī)器翻譯系統(tǒng)用中介語(yǔ)言邏輯表達(dá)式表示要生成的譯文是什么意思。一般來(lái)說(shuō),如果這個(gè)表達(dá)式里面有兩個(gè)謂詞結(jié)構(gòu),并且二者之間有“動(dòng)作—結(jié)果”關(guān)系,就可以進(jìn)入漢語(yǔ)動(dòng)結(jié)式的生成過(guò)程。
中介語(yǔ)言邏輯表達(dá)式是從源語(yǔ)(譬如英語(yǔ))分析得到的,源語(yǔ)中的述謂結(jié)構(gòu)和“動(dòng)作—結(jié)果”關(guān)系會(huì)在表達(dá)式中有所體現(xiàn)。但這并不是判斷能否生成漢語(yǔ)動(dòng)結(jié)式的惟一依據(jù)。我們?cè)谏弦还?jié)提到,英語(yǔ)往往沒(méi)有相當(dāng)于漢語(yǔ)動(dòng)結(jié)式的結(jié)構(gòu)形式,也很難用轉(zhuǎn)換規(guī)則把英語(yǔ)的某些結(jié)構(gòu)形式與漢語(yǔ)動(dòng)結(jié)式聯(lián)系起來(lái),這是就句法結(jié)構(gòu)來(lái)說(shuō)的。實(shí)際上,由于英、漢語(yǔ)之間在“動(dòng)作—結(jié)果”關(guān)系表達(dá)上的差異,(注:戴浩一(2002)指出:“動(dòng)作—結(jié)果”基模雖然在漢、英語(yǔ)中都存在,但是在漢語(yǔ)中占主導(dǎo)地位,而在英語(yǔ)中占次要甚至邊緣地位。而且,這個(gè)基模在兩個(gè)語(yǔ)言對(duì)客觀情況的構(gòu)建上也因經(jīng)驗(yàn)的概念化不同而呈現(xiàn)不同的形式。)在從源語(yǔ)分析得來(lái)的語(yǔ)義表達(dá)式里,可以用漢語(yǔ)動(dòng)結(jié)式生成的“動(dòng)作—結(jié)果”關(guān)系有時(shí)是隱含的,與此相關(guān)的述謂關(guān)系也有不同的表現(xiàn)形式。比如:
英語(yǔ)對(duì)動(dòng)作對(duì)象的描寫(xiě)在漢語(yǔ)中有時(shí)可以表達(dá)成動(dòng)作的結(jié)果:
She married the wrong person. 她嫁錯(cuò)了人。
He entered the wrong door. 他進(jìn)錯(cuò)了門(mén)。
漢語(yǔ)中動(dòng)詞的結(jié)果補(bǔ)語(yǔ)在英語(yǔ)中有時(shí)是說(shuō)明動(dòng)作的狀態(tài)和程度的成分:
電視看久了!o watch TV for a very long time.
我英語(yǔ)學(xué)晚了。 It was very late when I started to learn English.
還有,致使“動(dòng)作—結(jié)果”事件發(fā)生的某些因素在漢語(yǔ)里常?梢猿洚(dāng)動(dòng)結(jié)式的一個(gè)論元角色,(注:袁毓林(2001)稱其為外來(lái)的致事。)而在英語(yǔ)里它們往往充當(dāng)其他成分:
那場(chǎng)可怕的暴風(fēng)雪凍死了不少人。Many people froze to death in the terrible snowstorm.
沙發(fā)把你坐懶了。You are becoming lazy on the sofa.
所以我們需要一組規(guī)則,在要生成的語(yǔ)義表達(dá)式里判斷有沒(méi)有應(yīng)該用漢語(yǔ)動(dòng)結(jié)式表達(dá)的述謂關(guān)系。在這組規(guī)則里,除了兩個(gè)謂詞結(jié)構(gòu)及其顯性的“動(dòng)作—結(jié)果”關(guān)系符合判斷條件以外,還應(yīng)該有能夠識(shí)別和提取隱含的“動(dòng)作—結(jié)果”關(guān)系及其述謂結(jié)構(gòu)的條件。這就需要研究英語(yǔ)和漢語(yǔ)在表達(dá)“動(dòng)作—結(jié)果”關(guān)系時(shí)的差異。這種差異有時(shí)在某種類別下表現(xiàn)出來(lái),有時(shí)又很個(gè)性化,只跟具體詞語(yǔ)有關(guān)。目前機(jī)器翻譯系統(tǒng)還沒(méi)有找到這樣的規(guī)則。所以我們就暫時(shí)只能看到“她嫁給了錯(cuò)誤的人”和“他進(jìn)了錯(cuò)誤的門(mén)”這樣的譯文。
3.2 選擇詞語(yǔ)
選擇詞語(yǔ)需要有一部用于信息處理的漢語(yǔ)詞典,告訴我們?cè)~語(yǔ)和它們的意義,以及它們的用法(比如,謂詞的配價(jià)結(jié)構(gòu)及其論元的限制條件)。對(duì)于前面的例子,需要先在詞典里選出“小王”、“讀”、“懂”、“文章”這些詞,然后根據(jù)詞語(yǔ)的意義和邏輯關(guān)系為它們分派語(yǔ)義角色。這些詞在中介語(yǔ)言邏輯表達(dá)式里是實(shí)體和謂詞!傲恕、“結(jié)果”、“這”等是算子或關(guān)系,把它們轉(zhuǎn)成詞匯形式還需要另外的分析和處理。詞語(yǔ)選擇和語(yǔ)義角色分派的結(jié)果可以表示成樹(shù)形圖或特征集合等形式。
附圖
圖2 詞語(yǔ)選擇和角色分派的結(jié)果
Agen表示施事,Pred表示謂詞,Pati表示受事,Cont表示內(nèi)容,Expe表示經(jīng)驗(yàn)者(當(dāng)事)。
即使有一部詳盡的詞典,要讓機(jī)器根據(jù)意義選擇詞語(yǔ)也不是一件容易的事情。我們經(jīng)常需要在幾個(gè)同義詞或近義詞當(dāng)中進(jìn)行取舍。比如,漢語(yǔ)的“看”有read的意思,用它來(lái)表達(dá)我們要生成的意思比“讀”更地道。根據(jù)什么樣的規(guī)則選擇“看”,不選擇“讀”?目前漢語(yǔ)詞匯和語(yǔ)義的研究還不能形式化地回答這個(gè)問(wèn)題。機(jī)器翻譯系統(tǒng)只好先根據(jù)詞語(yǔ)搭配的優(yōu)先關(guān)系來(lái)判斷。一種作法是,借助描寫(xiě)詞語(yǔ)概念的語(yǔ)義詞典,用統(tǒng)計(jì)語(yǔ)言模型計(jì)算語(yǔ)義相似度,讓計(jì)算機(jī)學(xué)會(huì)表示和比較詞語(yǔ)搭配的優(yōu)先關(guān)系。但是,用這種工程化的方法并不能繞過(guò)漢語(yǔ)研究的作用,因?yàn)橐粋(gè)統(tǒng)計(jì)語(yǔ)言模型能否達(dá)到比較好的處理效果,很大程度上取決于采用什么樣的語(yǔ)言學(xué)知識(shí)作為參數(shù)。
3.3 判斷合法性
經(jīng)過(guò)詞語(yǔ)
選擇和角色分派,得到了圖2表示的兩個(gè)謂詞結(jié)構(gòu)。這一步的任務(wù)是,判斷能不能用動(dòng)結(jié)式述語(yǔ)結(jié)構(gòu)表示這兩個(gè)謂詞結(jié)構(gòu)及其關(guān)系。具體說(shuō)就是,“看”和“懂”能不能合成“看懂”,并且表示中介語(yǔ)言邏輯表達(dá)式要求的“動(dòng)作—結(jié)果”關(guān)系。因此合法性的問(wèn)題關(guān)系到哪些動(dòng)詞和哪些形容詞(或動(dòng)詞)能夠組合成符合漢語(yǔ)習(xí)慣的動(dòng)結(jié)式。
如果給機(jī)器翻譯系統(tǒng)提供一個(gè)詞表,列出一批動(dòng)結(jié)式的詞語(yǔ),而“看懂”又剛好在這個(gè)詞表里,那么判斷這件事情就比較容易。譬如,在動(dòng)詞“學(xué)”的兩個(gè)義項(xiàng)(“學(xué)習(xí)”和“模仿”)下面,《漢語(yǔ)動(dòng)詞用法詞典》(孟琮等,1999)列舉了8個(gè)動(dòng)結(jié)式實(shí)例,《中國(guó)語(yǔ)補(bǔ)語(yǔ)例解》(侯精一等,2001)列舉了12個(gè)。這兩部詞典是面向人的,如果給機(jī)器翻譯用就還需要收錄更多的實(shí)例。比如“學(xué)懂”、“學(xué)膩”,等等(我們?cè)诒疚牡牡谒牟糠至信e了“學(xué)”下面84個(gè)可能需要生成的動(dòng)結(jié)式實(shí)例)。實(shí)際上,詞表只適用于小范圍的實(shí)驗(yàn)型翻譯系統(tǒng)。動(dòng)結(jié)式述語(yǔ)是一種自由結(jié)構(gòu),是根據(jù)說(shuō)話的需要臨時(shí)造出來(lái)的,因此應(yīng)該是不勝枚舉的。
我們可以這樣想,“學(xué)”是一種認(rèn)知行為,“懂”、“明白”等詞語(yǔ)表示認(rèn)知活動(dòng)的效果,因此可以當(dāng)“學(xué)”的結(jié)果補(bǔ)語(yǔ)。但人們也常說(shuō)“這孩子學(xué)歪了”、“把身體學(xué)垮了”!巴帷焙汀翱濉庇指鶕(jù)什么是“學(xué)”的結(jié)果補(bǔ)語(yǔ)呢?這些補(bǔ)語(yǔ)該用什么條件來(lái)生成?我們將在第四部分進(jìn)一步討論這個(gè)問(wèn)題。
如果這一步判斷的結(jié)果是不能生成合法的動(dòng)結(jié)式,那么就需要回到上一步,重新選擇詞語(yǔ),直到找不到符合預(yù)定的語(yǔ)義要求的詞語(yǔ)為止。
3.4 整合語(yǔ)義結(jié)構(gòu)
作為一個(gè)述謂性的結(jié)構(gòu)整體,動(dòng)結(jié)式有自己語(yǔ)義上的支配成分,包括論元成分和附加成分,我們把這些語(yǔ)義關(guān)系的和統(tǒng)稱為語(yǔ)義結(jié)構(gòu)。在這一步,我們需要根據(jù)動(dòng)詞和補(bǔ)語(yǔ)各自的語(yǔ)義結(jié)構(gòu),確定動(dòng)結(jié)式整體的語(yǔ)義結(jié)構(gòu),主要是配價(jià)結(jié)構(gòu)(價(jià)語(yǔ)的數(shù)量和性質(zhì))。
動(dòng)結(jié)式的配價(jià)結(jié)構(gòu)不等于其構(gòu)件(動(dòng)詞或補(bǔ)語(yǔ))的配價(jià)結(jié)構(gòu),也不簡(jiǎn)單地等于二者之和。動(dòng)結(jié)式的配價(jià)與其構(gòu)件的配價(jià)之間有沒(méi)有對(duì)應(yīng)關(guān)系?如何從動(dòng)詞和補(bǔ)語(yǔ)各自的配價(jià)結(jié)構(gòu)得到動(dòng)結(jié)式的配價(jià)結(jié)構(gòu)?袁毓林(2001)、郭銳(1995)和王紅旗(1995)都曾經(jīng)作過(guò)研究,在解釋成因的同時(shí),尋找動(dòng)結(jié)式對(duì)其構(gòu)件原有的論元進(jìn)行選擇的控制規(guī)則。在一定范圍內(nèi)應(yīng)用這些規(guī)則,我們可以從動(dòng)詞和補(bǔ)語(yǔ)的配價(jià)結(jié)構(gòu)推算出動(dòng)結(jié)式的配價(jià)結(jié)構(gòu)。包括價(jià)語(yǔ)的數(shù)量:動(dòng)結(jié)式是一價(jià)的、二價(jià)的,還是三價(jià)的;以及價(jià)語(yǔ)的性質(zhì):動(dòng)結(jié)式述語(yǔ)結(jié)構(gòu)中各個(gè)論元的語(yǔ)義角色是什么(主要分為主體格(主論元)、客體格(賓論元))。對(duì)于前面的例句,我們就可以得到,動(dòng)結(jié)式“看懂”是二價(jià)的,它的兩個(gè)論元是“他”(主體格)和“文章”(客體格)。價(jià)語(yǔ)的數(shù)量和性質(zhì)是下一步選擇句法結(jié)構(gòu)的主要依據(jù)。
在動(dòng)結(jié)式生成的整個(gè)過(guò)程中,漢語(yǔ)語(yǔ)法學(xué)者提出的論元整合規(guī)則是可以直接影響生成算法的規(guī)則,這樣的結(jié)論在目前的漢語(yǔ)語(yǔ)法研究中還為數(shù)甚少。機(jī)器翻譯十分重視這一組規(guī)則的作用,也期待著對(duì)它更加深入的研究和完善。(注:譬如,袁毓林(2001)提出的準(zhǔn)入規(guī)則在論元整合結(jié)果為等價(jià)的情況下是有效的,也是可操作的,對(duì)增價(jià)的情況雖然有處理的規(guī)則,但是計(jì)算機(jī)不大容易操作,對(duì)減價(jià)的情況還沒(méi)有提出有效的處理辦法。)
3.5 選擇句法表現(xiàn)形式
這一步要做的是,選擇什么樣的句法手段去表現(xiàn)動(dòng)結(jié)式的語(yǔ)義結(jié)構(gòu)。動(dòng)結(jié)式有很多表層結(jié)構(gòu)類型,李臨定(1986,181-204頁(yè))曾歸納了五類句型:
(1)N[,1]+V+C 媽媽急哭了
(2)N[,1]+V+N[,2]+V+C 他走路走累了
(3)N[,1]+V+C+N[,2] 我點(diǎn)亮了油燈
(4)N[,1]+V+N[,2]+V+C+N[,3] 他拍桌子拍疼了手
(5)N[,1]+把+N[,2]+V+C+N[,3] 火把他的衣服燒穿了幾個(gè)洞
前四類還各有四種可能的表層變換形式(“把”、“被”、“得”字句及其他)。到底應(yīng)該選取哪一種生成我們的句子呢?這是如何在語(yǔ)義結(jié)構(gòu)和句法結(jié)構(gòu)之間尋找對(duì)應(yīng)關(guān)系的問(wèn)題,我們打算在第五部分就這個(gè)問(wèn)題作進(jìn)一步的討論。
3.6 處理表層詞語(yǔ)
選定了句子的表層結(jié)構(gòu)和語(yǔ)序以后,剩下的事是用詞匯手段表達(dá)某些句法或語(yǔ)義范疇。比如:時(shí)、體、否定、指代、有定、數(shù)量,等等。然后輸出最后生成的結(jié)果。對(duì)于我們的例子就是:“他看懂了這篇文章”。句子里的“了”、“這”和“篇”是在這一步生成的。
機(jī)器翻譯生成漢語(yǔ)動(dòng)結(jié)式時(shí),在句子表層要處理的問(wèn)題很多,每一個(gè)問(wèn)題也都很復(fù)雜,比如時(shí)體成分、否定成分的語(yǔ)序等,需要作專門(mén)的研究。
3.7 操作過(guò)程的控制
需要說(shuō)明的是,上面各個(gè)步驟的操作并不是無(wú)條件依次進(jìn)行的。當(dāng)在某一步無(wú)法得到確定的結(jié)論時(shí),應(yīng)該中止動(dòng)結(jié)式的生成過(guò)程。
4.動(dòng)詞和結(jié)果補(bǔ)語(yǔ)的組合關(guān)系
動(dòng)詞和結(jié)果補(bǔ)語(yǔ)的組合應(yīng)該是基于語(yǔ)義的。要想離開(kāi)詞表的限制,判斷哪些動(dòng)詞和哪些形容詞(或動(dòng)詞)可以組合成符合漢語(yǔ)習(xí)慣的動(dòng)結(jié)式,就需要從語(yǔ)義上研究動(dòng)補(bǔ)之間的組合類型和規(guī)則。顯然,這件事情不是機(jī)器翻譯力所能及的。在這里我們只能先從個(gè)例入手,看看單音節(jié)動(dòng)詞和單音節(jié)形容詞作動(dòng)詞“學(xué)”的結(jié)果補(bǔ)語(yǔ)的情況,或許能夠從中看到這個(gè)問(wèn)題的困難所在。
動(dòng)詞“學(xué)”的意思是“學(xué)習(xí)”或“模仿”。在《現(xiàn)代漢語(yǔ)語(yǔ)法信息詞典》(注:由北京大學(xué)研制的用于信息處理的電子詞典,其中有按義項(xiàng)收錄的14479個(gè)動(dòng)詞,2856個(gè)形容詞。通過(guò)檢索每個(gè)詞的屬性,我們可以知道哪些動(dòng)詞可以帶結(jié)果補(bǔ)語(yǔ),哪些形容詞、動(dòng)詞可以作結(jié)果補(bǔ)語(yǔ)。)(俞士汶,1998,以下稱《語(yǔ)法信息詞典》)中,列出了可以作結(jié)果補(bǔ)語(yǔ)的單音節(jié)形容詞204個(gè),(注:馬真等(1997)列出了可以作結(jié)果補(bǔ)語(yǔ)的單音節(jié)形容詞153個(gè)。)單音節(jié)動(dòng)詞112個(gè)。經(jīng)過(guò)一一搭配測(cè)試,其中有54個(gè)形容詞和30個(gè)動(dòng)詞能作“學(xué)”的結(jié)果補(bǔ)語(yǔ)。這樣我們就從《語(yǔ)法信息詞典》中一共得到了84個(gè)可能的動(dòng)結(jié)式實(shí)例。然后按照《知網(wǎng)》(注:用于自然語(yǔ)言處理的知識(shí)系統(tǒng),由董振東等研制。以從大量詞語(yǔ)中提取出來(lái)的“義原”為基本描述單位,采用一種結(jié)構(gòu)化的描述語(yǔ)言來(lái)描述概念與概念之間,以及概念的屬性與屬性之間的關(guān)系,包括上下位關(guān)系、同義關(guān)系、反義關(guān)系、對(duì)義關(guān)系、部件與整體關(guān)系、材料和成品關(guān)系、屬性和宿主關(guān)系,以及屬性值和屬性的指向關(guān)系、時(shí)間和角色關(guān)系;ヂ(lián)網(wǎng)網(wǎng)址:http://www.keenage.com)(董振東等,2001)的定義為每一個(gè)實(shí)例的補(bǔ)語(yǔ)作語(yǔ)義類別標(biāo)注,再作聚類分析,整理出“學(xué)”的結(jié)果補(bǔ)語(yǔ)的六個(gè)語(yǔ)義類別。其中A、E、F三類作補(bǔ)語(yǔ)的是形容詞,B、C、D三類作補(bǔ)語(yǔ)的是動(dòng)詞,分別列在下面(括號(hào)里面是《知網(wǎng)》定義的義原)。
A.人的客觀屬性(智能、舉止、年齡、外貌、品性、經(jīng)濟(jì)狀況)
A1.[智能]學(xué)笨了 學(xué)昏了 學(xué)蒙了 學(xué)癡了 學(xué)蠢了 學(xué)土了 學(xué)呆了 學(xué)木了 學(xué)乖了 學(xué)傻了
A2.[舉止]學(xué)刁了 學(xué)歪了 學(xué)賊了 學(xué)油了 學(xué)浮了 學(xué)狠了 學(xué)犟了 學(xué)俗了 學(xué)倔了 學(xué)皮了 學(xué)酸了 學(xué)混了 學(xué)摳了
A3.[年齡]學(xué)老了
A4.[經(jīng)濟(jì)狀況]學(xué)富了 學(xué)窮了
A5.
[品性]學(xué)差了 學(xué)廢了 學(xué)好了 學(xué)黑了 學(xué)壞了 學(xué)糟了
A6.[外貌]學(xué)俏了
B.人的主觀感受(態(tài)度、感知)
B1.[態(tài)度]學(xué)煩了 學(xué)夠了 學(xué)慣了 學(xué)迷了 學(xué)惱了 學(xué)膩了 學(xué)怕了
B2.[感知]學(xué)懂了 學(xué)乏了 學(xué)會(huì)了 學(xué)累了 學(xué)通了 學(xué)忘了
C.人的狀態(tài)和行為(狀態(tài)、行動(dòng))
C1.[狀態(tài)]學(xué)病了 學(xué)成了 學(xué)瘋了 學(xué)垮了 學(xué)虧了 學(xué)蔫了 學(xué)瘸了 學(xué)死了 學(xué)癱了 學(xué)啞了 學(xué)暈了
C2.[行動(dòng)]學(xué)哭了 學(xué)跑了 學(xué)散了 學(xué)走了
D.事物的狀態(tài)(狀態(tài))
學(xué)丟了 學(xué)沒(méi)了
E.事物的特性(特性)
學(xué)反了 學(xué)活了 學(xué)偏了 學(xué)淺了 學(xué)深了 學(xué)雜了 學(xué)窄了 學(xué)足了
F.事件的特性(特性)
學(xué)遍了 學(xué)遲了 學(xué)重了 學(xué)錯(cuò)了 學(xué)對(duì)了 學(xué)多了 學(xué)久了 學(xué)濫了 學(xué)全了 學(xué)少了 學(xué)透了 學(xué)晚了 學(xué)早了
可以看出,“學(xué)”和它的結(jié)果補(bǔ)語(yǔ)之間在概念意義的組合上遵循一定的規(guī)律。能否根據(jù)這些規(guī)律,用計(jì)算機(jī)可操作的方法,在一定范圍內(nèi)判斷詞表以外的動(dòng)結(jié)式實(shí)例是否合法?比如,《語(yǔ)法信息詞典》沒(méi)有把“精”列入可作結(jié)果補(bǔ)語(yǔ)的形容詞當(dāng)中,但是“學(xué)精了”是個(gè)合法的動(dòng)結(jié)式實(shí)例。計(jì)算機(jī)可以這樣來(lái)確認(rèn)它的合法性:根據(jù)《知網(wǎng)》,“精”的定義是[智能>靈](“>”的右部是左部的下位概念。下同),在A1類[智能>愚/訥/智/靈](“/”表示“或”的意思。下同。)的范圍內(nèi)。同樣,與“精”定義相同的“鬼”、“靈”、“巧”,雖然也沒(méi)有被《語(yǔ)法信息詞典》指明可作結(jié)果補(bǔ)語(yǔ),但計(jì)算機(jī)仍然能夠判定“學(xué)鬼了”、“學(xué)靈了”和“學(xué)巧了”是合法的動(dòng)結(jié)式實(shí)例。
對(duì)于動(dòng)補(bǔ)之間的語(yǔ)義組合,結(jié)果補(bǔ)語(yǔ)的概念意義是在動(dòng)詞概念意義的制約下起作用的。我們?cè)賮?lái)看與“學(xué)”有對(duì)義關(guān)系(Converse)的動(dòng)詞“教”!皩W(xué)”和“教”都表示認(rèn)知行為,前者是使自我認(rèn)知,后者是使他人認(rèn)知。因此有可能要求相似的結(jié)果補(bǔ)語(yǔ)。實(shí)際上,“學(xué)”的結(jié)果補(bǔ)語(yǔ)基本上都可以作“教”的結(jié)果補(bǔ)語(yǔ)。(注:盡管各自的語(yǔ)義指向可能不同,比如:“學(xué)笨了”和“教笨了”。這與動(dòng)詞的配價(jià)結(jié)構(gòu)有關(guān)。在機(jī)器翻譯生成動(dòng)結(jié)式的過(guò)程中,由“整合語(yǔ)義結(jié)構(gòu)”這一步處理。)它們或者表示認(rèn)知行為對(duì)其主體(“學(xué)”的施事、“教”的與事)產(chǎn)生的效果:改變主體的客觀屬性(智能、舉止、年齡、外貌、品性、經(jīng)濟(jì)狀況)、主觀感受(態(tài)度、感知)、狀態(tài)和行為;或者表示認(rèn)知行為對(duì)其涉及的事物產(chǎn)生的效果:改變涉及對(duì)象的狀態(tài)、性質(zhì)(長(zhǎng)短、寬窄、深淺、多少、正反、美丑);或者表示認(rèn)知行為本身的特性(度量、頻率、程度)。不同的“動(dòng)作—結(jié)果”關(guān)系產(chǎn)生了不同的動(dòng)補(bǔ)組合關(guān)系,要把它們研究清楚,整理成規(guī)則,是一件非常復(fù)雜的事情。
即使有了基于詞語(yǔ)概念意義的規(guī)則,也還不能完全解決問(wèn)題。在《知網(wǎng)》中,與“懂”有相同定義的單音節(jié)動(dòng)詞還有“認(rèn)”、“審”、“識(shí)”、“通”、“悉”、“曉”、“知”。除了“通”以外,其余的都不能作“學(xué)”的結(jié)果補(bǔ)語(yǔ)。與“精”定義相同的雙音節(jié)形容詞“聰明”、“機(jī)靈”、“伶俐”、“乖巧”可以作“學(xué)”的結(jié)果補(bǔ)語(yǔ),而同樣定義的“聰穎”、“聰慧”卻不行。這說(shuō)明影響動(dòng)詞和結(jié)果補(bǔ)語(yǔ)組合關(guān)系的因素不僅僅是詞語(yǔ)的概念意義。那么,到底還有哪些因素可以作為判斷動(dòng)結(jié)式合法與否的條件?如何把這些條件變成計(jì)算機(jī)可以操作的規(guī)則?我們現(xiàn)在還不得而知。
5.從語(yǔ)義結(jié)構(gòu)到句法表現(xiàn)形式
在動(dòng)結(jié)式的整個(gè)生成過(guò)程中,選擇什么樣的句法手段來(lái)表現(xiàn)其語(yǔ)義結(jié)構(gòu)是比較復(fù)雜的一步。人們常說(shuō),漢語(yǔ)句法結(jié)構(gòu)和語(yǔ)義結(jié)構(gòu)之間的聯(lián)系比較松散,或者說(shuō)句法成分和語(yǔ)義成分的配位很靈活,一種結(jié)構(gòu)形式經(jīng)常表示多種意義,一種語(yǔ)義內(nèi)容也可以用多種結(jié)構(gòu)形式來(lái)表示。這就給機(jī)器翻譯的漢語(yǔ)生成帶來(lái)很大的困難。對(duì)于動(dòng)結(jié)式表層句法結(jié)構(gòu)的選擇,我們目前能用到的條件非常有限,所以能生成的句型也很有限。
5.1 使生成目標(biāo)受限
通過(guò)整合語(yǔ)義結(jié)構(gòu)我們得到了動(dòng)結(jié)式的配價(jià)結(jié)構(gòu),價(jià)語(yǔ)的數(shù)量可以幫助我們選擇句型。如果動(dòng)結(jié)式是一價(jià)的,選擇有一個(gè)體詞性成分出現(xiàn)的句型;是二價(jià)的,選擇包含兩個(gè)體詞性成分的句型。至于在同屬一類句型的多個(gè)表層結(jié)構(gòu)形式中間應(yīng)該選擇哪一個(gè),還需要更細(xì)致的條件和規(guī)則。下面討論如何把動(dòng)結(jié)式組成成分之間的語(yǔ)義關(guān)系作為選擇的條件。
為了簡(jiǎn)化討論的過(guò)程,我們?cè)谶@里只考慮二價(jià)動(dòng)結(jié)式的情況(略去“媽媽急哭了”、“他看書(shū)看花了眼”、“他扔進(jìn)屋一塊石頭”等)。這樣,討論的范圍就限制在只含有兩個(gè)體詞性成分的表層結(jié)構(gòu)形式里面。呂叔湘(1986)曾經(jīng)按照補(bǔ)語(yǔ)跟主語(yǔ)或賓語(yǔ)的語(yǔ)義關(guān)系,把動(dòng)結(jié)式述補(bǔ)結(jié)構(gòu)分成15類(略去“得”字句等),其中有兩個(gè)體詞性論元成分出現(xiàn)的共9類(包括用“把”和“被的句子),分屬以下三種語(yǔ)義關(guān)系格式,其中S是V的主體格。(注:在本節(jié)討論的范圍內(nèi),主體格包括施事、當(dāng)事;客體格包括受事、內(nèi)容。)
附圖
綜合上述各種情況可以看出,二價(jià)動(dòng)結(jié)式的六種語(yǔ)義結(jié)構(gòu)可以用以下五種表層結(jié)構(gòu)形式來(lái)表達(dá)。下面的討論將在這個(gè)范圍以內(nèi)進(jìn)行:
表層結(jié)構(gòu)1:S+V+C+O
表層結(jié)構(gòu)2:S+“把”+O+V+C
表層結(jié)構(gòu)3:O+“把”+S+V+C
表層結(jié)構(gòu)4:O+“被”+S+V+C
表層結(jié)構(gòu)5:S+“被”+O+V+C
我們注意到,同時(shí)與二價(jià)動(dòng)結(jié)式的六種語(yǔ)義結(jié)構(gòu)有對(duì)應(yīng)關(guān)系的只有表層結(jié)構(gòu)1(S+V+C+O),所以可以把它當(dāng)作生成動(dòng)結(jié)式表層的首選。可是進(jìn)一步觀察就會(huì)發(fā)現(xiàn),在用表層結(jié)構(gòu)1表達(dá)某些語(yǔ)義結(jié)構(gòu)時(shí)會(huì)受到限制。譬如語(yǔ)義結(jié)構(gòu)Ⅱ,我們可以說(shuō)“大家吃膩了剩菜”,卻不能說(shuō)“我丟怕了錢包”,也不能說(shuō)“他看傻了那幅畫(huà)”。能說(shuō)與不能說(shuō)應(yīng)該有條件來(lái)控制,O和C之間的語(yǔ)義關(guān)系可能是一個(gè)控制條件,但是目前還沒(méi)有確切的規(guī)則可用。
在這種情況下,只好先避開(kāi)表層結(jié)構(gòu)1,選擇2和3。經(jīng)過(guò)初步實(shí)驗(yàn)我們看到,就表達(dá)命題意義來(lái)說(shuō),用表層結(jié)構(gòu)3表達(dá)語(yǔ)義結(jié)構(gòu)Ⅱ,用表層結(jié)構(gòu)2表達(dá)語(yǔ)義結(jié)構(gòu)Ⅰ、Ⅲ、Ⅳ、Ⅴ、Ⅵ,受到的限制最少。這樣,討論的范圍又縮小到了兩種表層結(jié)構(gòu)形式。問(wèn)題就變成了:如何找到用這兩種句法形式表達(dá)六種語(yǔ)義關(guān)系格式的控制條件。我們把這種逐步縮小問(wèn)題范圍的做法叫作使生成目標(biāo)受限,實(shí)際上這是對(duì)復(fù)雜問(wèn)題的一種妥協(xié)。也就是對(duì)二價(jià)動(dòng)結(jié)式,放棄生成所有的表層句式,尋找盡可能簡(jiǎn)單和有效的控制條件,先用部分表層結(jié)構(gòu)形式表達(dá)其多種語(yǔ)義格式。
5.2 生成表層結(jié)構(gòu)的控制條件
從語(yǔ)義結(jié)構(gòu)生成表層結(jié)構(gòu)的主要控制條件是動(dòng)結(jié)式組成成分之間的語(yǔ)義關(guān)系。
對(duì)于二價(jià)動(dòng)結(jié)式的組成成分S、O、V、C,如果S是V的主體格,而且:
。ㄒ唬┤绻鸖、O、V、C相互之間滿足下列五個(gè)條件之一,則可以用表層結(jié)構(gòu)2表達(dá):
1.(O是V的客體格)且(O是C的主體格)且(C是一價(jià)的)
2.(S是C的主體格)且(O是V的客體格)且(O是C的客體格)
3.(O是C的主體格)且(V和C都是一價(jià)的)
4.(S是C的主體格)且(O是C的客體格)且(V是一價(jià)的)
5.(O是V的客體格)且(C是V的修飾成分)
。ǘ┤绻鸖、O、V、C相互之間滿足條件6,則可以用表層結(jié)構(gòu)3表達(dá):
6.(O是V的客體格)且(S是C的主體格)且(C是一價(jià)的)
表層結(jié)構(gòu)2和3都是“把”字句。關(guān)于“把”字句,很多學(xué)者從各種角度作過(guò)研究。張伯江(2000)曾根據(jù)句式語(yǔ)法的觀點(diǎn)指出,除了組成成分的作用以外,“把”字句的整體意義當(dāng)中還有句式意義的作用。因此,生成的時(shí)候還應(yīng)當(dāng)考慮上述控制條件能否符合“把”字句句式意義的要求。我們注意到,動(dòng)結(jié)式與“把”字句似乎有一種自然的聯(lián)系!鞍选弊志渲蠽的“處置”意義、C是“把”后面賓語(yǔ)產(chǎn)生的變化等句式意義與動(dòng)結(jié)式的句式意義基本相似。(注:在動(dòng)結(jié)式的表層結(jié)構(gòu)2中,賓語(yǔ)是O;在表層結(jié)構(gòu)3中,賓語(yǔ)是S。)另外,為了體現(xiàn)“把”字句里動(dòng)作過(guò)程的完整性,我們?cè)谏蛇^(guò)程的最后一步(處理表層詞語(yǔ))規(guī)定,“把”字后面排斥否定謂語(yǔ)形式。
根據(jù)我們的觀察和實(shí)驗(yàn),在二價(jià)動(dòng)結(jié)式述語(yǔ)結(jié)構(gòu)的五種表層形式中,“把”字句在語(yǔ)義表達(dá)的適應(yīng)性上比較好,常常能夠包容除語(yǔ)義關(guān)系之外的其他一些選擇控制因素。譬如,補(bǔ)語(yǔ)是雙音節(jié)的動(dòng)結(jié)式一般不宜選擇表層結(jié)構(gòu)S+V+C+O,但“把”字句不受這個(gè)限制。再如,用“把”字句來(lái)表達(dá)“你把坑挖淺了”這一類含有動(dòng)結(jié)式的句子,正好能夠表示其偏離預(yù)期結(jié)果的意思,比用其他表層結(jié)構(gòu)更合適一些!鞍选弊志湓趧(dòng)結(jié)式生成中為什么會(huì)有這樣的表現(xiàn)?這不是機(jī)器翻譯能夠解釋的問(wèn)題。
現(xiàn)在再來(lái)看我們要生成的例句:“小王讀了這篇文章,結(jié)果小王懂了這篇文章”。經(jīng)過(guò)“動(dòng)作—結(jié)果”述謂關(guān)系的判斷、詞語(yǔ)選擇、合法性判定和語(yǔ)義結(jié)構(gòu)整合,我們得知,它可以生成一個(gè)二價(jià)的動(dòng)結(jié)式述補(bǔ)結(jié)構(gòu),其中各個(gè)組成成分之間的語(yǔ)義關(guān)系是:
S→V←O & S→C←O
這種語(yǔ)義結(jié)構(gòu)符合控制條件2(S是V和C的主體格,而且O是V和C的客體格)。因此為它選擇的表層句法形式是:
S+“把”+O+V+C
再經(jīng)過(guò)表層詞語(yǔ)的處理,最后生成:
小王把這篇文章看懂了。
6.余論
戴浩一(2002)在論述漢語(yǔ)語(yǔ)法的哲學(xué)基礎(chǔ)時(shí)指出,語(yǔ)法現(xiàn)象是概念系統(tǒng)概念化的結(jié)果。他從宏觀角度提出了從概念結(jié)構(gòu)到漢語(yǔ)句法和詞匯形式的過(guò)程,說(shuō)明在這個(gè)過(guò)程中起作用的是漢語(yǔ)的概念化原則。應(yīng)該說(shuō),機(jī)器翻譯從中介語(yǔ)言邏輯表達(dá)式生成動(dòng)結(jié)式譯文的過(guò)程就是這樣一個(gè)實(shí)例。從“動(dòng)作—結(jié)果”述謂關(guān)系的判斷、詞語(yǔ)選擇、合法性判定、語(yǔ)義結(jié)構(gòu)整合、直到句法形式選擇和表層詞語(yǔ)處理,我們需要的是具體的、可操作的句法化、詞匯化的原則和規(guī)則,這樣才能從生成機(jī)制上找到動(dòng)結(jié)式的構(gòu)成條件。多年來(lái),漢語(yǔ)語(yǔ)法一直比較重視動(dòng)結(jié)式述語(yǔ)結(jié)構(gòu)的研究,在結(jié)構(gòu)層次、結(jié)構(gòu)關(guān)系、句法功能、語(yǔ)義關(guān)系、配價(jià)結(jié)構(gòu),還有組成成分的特征和性質(zhì)等問(wèn)題上有許多論述。只是研究結(jié)論多數(shù)是面向人的,能為漢語(yǔ)信息處理和機(jī)器翻譯所用的還不多。比如,關(guān)于動(dòng)結(jié)式是如何形成的,人們大多從歷時(shí)的角度,指出它的來(lái)源是古代漢語(yǔ)的使動(dòng)用法。而機(jī)器翻譯需要的是從共時(shí)的角度找到動(dòng)結(jié)式形成的控制條件,告訴計(jì)算機(jī),在什么情況下,哪些動(dòng)詞和哪些形容詞(或動(dòng)詞)可以組合成、以及怎么組合成符合漢語(yǔ)習(xí)慣的動(dòng)結(jié)式述語(yǔ)結(jié)構(gòu)。還有,如何從要生成的句子意思里找到“動(dòng)作—結(jié)果”關(guān)系及其述謂結(jié)構(gòu)?如何根據(jù)要表達(dá)的意思選擇合適的詞語(yǔ)?如何從動(dòng)詞和補(bǔ)語(yǔ)的配價(jià)結(jié)構(gòu)推算出動(dòng)結(jié)式的配價(jià)結(jié)構(gòu)?如何從動(dòng)結(jié)式的語(yǔ)義結(jié)構(gòu)選擇它的句法表現(xiàn)形式?以及如何在句子表層處理時(shí)體成分、否定成分、指代關(guān)系、數(shù)量關(guān)系?在沒(méi)有找到解決這些問(wèn)題的有效規(guī)則以前,機(jī)器翻譯系統(tǒng)還只能采用某些權(quán)宜之計(jì)來(lái)生成漢語(yǔ)的動(dòng)結(jié)式。
在強(qiáng)調(diào)規(guī)則的作用的同時(shí),我們也看到統(tǒng)計(jì)語(yǔ)言模型的方法近年來(lái)越來(lái)越多地應(yīng)用在語(yǔ)言工程中,出現(xiàn)了基于實(shí)例的和基于統(tǒng)計(jì)的機(jī)器翻譯系統(tǒng)。在人們對(duì)語(yǔ)言和翻譯的機(jī)制還缺乏系統(tǒng)的了解,還沒(méi)有一種適合信息處理的語(yǔ)言理論可以應(yīng)用的時(shí)候,統(tǒng)計(jì)語(yǔ)言模型可能會(huì)起到某種依靠“量”來(lái)獲取“質(zhì)”的作用。它的前提是,大量語(yǔ)言現(xiàn)象的統(tǒng)計(jì)規(guī)律能夠確切地反映語(yǔ)句的構(gòu)造規(guī)律和言語(yǔ)過(guò)程的認(rèn)知規(guī)律。而實(shí)際上,這還是有待證明的觀點(diǎn)。更何況統(tǒng)計(jì)語(yǔ)言模型需要建立在語(yǔ)言學(xué)知識(shí)的基礎(chǔ)上,一個(gè)語(yǔ)言模型能否達(dá)到比較好的處理效果,很大程度上取決于我們能為它提供什么樣的語(yǔ)言學(xué)知識(shí)作為參數(shù)。計(jì)算的任務(wù)是獲取參數(shù)之間的統(tǒng)計(jì)學(xué)規(guī)律,參數(shù)才是建立模型的根本。目前統(tǒng)計(jì)模型方法在機(jī)器翻譯系統(tǒng)中效果不佳,其主要原因應(yīng)該不是模型本身的計(jì)算能力有限,而是能夠提供給模型的關(guān)于機(jī)器翻譯的知識(shí)太少。漢語(yǔ)語(yǔ)法研究目前還沒(méi)有發(fā)掘出足夠的這一類知識(shí),或者是還沒(méi)有把它們系統(tǒng)地、結(jié)構(gòu)化地組織起來(lái)。這一點(diǎn)對(duì)基于規(guī)則的方法來(lái)說(shuō),同樣也是亟待解決的問(wèn)題。
從機(jī)器翻譯系統(tǒng)總體設(shè)計(jì)的角度說(shuō),漢語(yǔ)動(dòng)結(jié)式的生成包括兩個(gè)方面的問(wèn)題。一個(gè)是根據(jù)哪些語(yǔ)言知識(shí)來(lái)生成,這與漢語(yǔ)研究有密切關(guān)系;另一個(gè)是怎樣實(shí)現(xiàn)生成的過(guò)程,這是把問(wèn)題形式化和設(shè)計(jì)算法的事情。我們討論的內(nèi)容只涉及第一個(gè)方面,目的是通過(guò)對(duì)動(dòng)結(jié)式生成過(guò)程的描述,看看它需要哪些語(yǔ)言學(xué)知識(shí)的支持。實(shí)際上,我們談到的生成過(guò)程還相當(dāng)粗略,提出的問(wèn)題也僅僅是一小部分。曾經(jīng)有人(白碩,1996)說(shuō)過(guò),繼說(shuō)本族語(yǔ)言的人和說(shuō)非本族語(yǔ)言的人之后,計(jì)算機(jī)的出現(xiàn)給語(yǔ)言研究帶來(lái)了一個(gè)新的參照物。它將幫助人們認(rèn)識(shí)到一些在舊的參照物下很難揭示出來(lái)的語(yǔ)言現(xiàn)象和規(guī)律。希望我們提出的這些問(wèn)題也能成為這樣的一種“參照”。
【參考文獻(xiàn)】
1 白碩 1996 《語(yǔ)言研究中的實(shí)用主義》,《計(jì)算機(jī)時(shí)代的漢語(yǔ)和漢字研究》,北京,清華大學(xué)出版社。
2 戴浩一 2002 《概念結(jié)構(gòu)與非自主性語(yǔ)法:漢語(yǔ)語(yǔ)法概念系統(tǒng)初探》,《當(dāng)代語(yǔ)言學(xué)》第1期。
3 董振東等 2001 《知網(wǎng)和漢語(yǔ)研究》,《當(dāng)代語(yǔ)言學(xué)》第1期。
4 郭銳 1995 《述結(jié)式的配價(jià)結(jié)構(gòu)與成分的整合》,《現(xiàn)代漢語(yǔ)配價(jià)語(yǔ)法研究》,沈陽(yáng)等主編,北京大學(xué)出版社。
5 侯精一等 2001 《中國(guó)語(yǔ)補(bǔ)語(yǔ)例解》(日文版),北京,商務(wù)印書(shū)館。
6 黃昌寧等主編 2001 《自然語(yǔ)言理解與機(jī)器翻譯》,北京,清華大學(xué)出版社。
7 Hutchins,W.J. 1993 《機(jī)器翻譯:過(guò)去、現(xiàn)在、未來(lái)》,臺(tái)灣,致文有限公司。
8 李臨定 1986 《現(xiàn)代漢語(yǔ)句型》,商務(wù)印書(shū)館。
9 —— 1980 《動(dòng)補(bǔ)格句式》,《中國(guó)語(yǔ)文》第2期。
10 陸儉明 1990 《“VA了”述補(bǔ)結(jié)構(gòu)的語(yǔ)義分析》,《漢語(yǔ)學(xué)習(xí)》第1期。
11 呂叔湘 1986 《漢語(yǔ)句法的靈活性》,《中國(guó)語(yǔ)文》第1期。
12 馬希文 1987 《與動(dòng)結(jié)式動(dòng)詞有關(guān)的句式》,《中國(guó)語(yǔ)文》第6期。
13 馬真等 1997 《形容詞作結(jié)果補(bǔ)語(yǔ)情況考察》,《漢語(yǔ)學(xué)習(xí)》第1期。
14 孟琮等 1999 《漢語(yǔ)動(dòng)詞用法詞典》,北京,商務(wù)印書(shū)館。
15 王紅旗 1995 《動(dòng)結(jié)式述補(bǔ)結(jié)構(gòu)配價(jià)研究》,《現(xiàn)代漢語(yǔ)配價(jià)語(yǔ)法研究》,沈陽(yáng)等主編,北京大學(xué)出版社。
16 翁富良等 1998 《計(jì)算語(yǔ)言學(xué)導(dǎo)論》,北京,中國(guó)社
會(huì)科學(xué)出版社。
17 俞士汶 1998 《現(xiàn)代漢語(yǔ)語(yǔ)法信息詞典》,清華大學(xué)出版社。
18 袁毓林 2001 《述結(jié)式配價(jià)的控制—還原分析》,《中國(guó)語(yǔ)文》第5期。
19 張伯江 2000 《論“把”字句的句式語(yǔ)義》,《語(yǔ)言研究》第1期。
【機(jī)器翻譯中漢語(yǔ)動(dòng)結(jié)式生成的過(guò)程和困難】相關(guān)文章:
讓語(yǔ)文教學(xué)在預(yù)設(shè)和生成中綻放活力08-17
情動(dòng)于中而形于外08-17
漢語(yǔ)中結(jié)構(gòu)話題的語(yǔ)用解釋和關(guān)系化08-07
中廣進(jìn)入中寶過(guò)程08-05
在困難中前行作文01-22
在困難中成長(zhǎng)作文12-23
生活中的困難作文07-27