午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

計算機輔助翻譯方法

文檔序號:9349935閱讀:2932來源:國知局
計算機輔助翻譯方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機輔助翻譯(computer aided translat1n,CAT)方法。
【背景技術(shù)】
[0002]目前,基于計算機實現(xiàn)的機器翻譯(MT)技術(shù)有可分為基于規(guī)則的機器翻譯(RBMT)、基于統(tǒng)計的機器翻譯(SMT)、基于實例的機器翻譯(EBMT)、基于模板的機器翻譯(TBMT)的機器翻譯技術(shù)等。另外,還存在以翻譯記憶(translat1n memory,TM)技術(shù)為代表的計算機輔助翻譯技術(shù)。
[0003]無論是機器翻譯還是計算機輔助翻譯,都是將待翻譯語言(以下,有時記作第一語言)的語句翻譯成目標語言(以下,有時記作第二語言)的語句。但在目前的計算機翻譯(包括計算機機器翻譯和計算機輔助翻譯)產(chǎn)品中,在第一語言和第二語言之間的對應關(guān)系的顯示方面存在許多問題。
[0004]例如,如圖1所示,第一語言位于左側(cè),作為翻譯結(jié)果的第二語言位于右側(cè)。它們分別由多個翻譯子單元(以下有時簡稱做子單元)構(gòu)成。所謂翻譯子單元是指句子的各個組成部分,它們可大體分類為具有實際含義的詞匯以及僅表示語法信息的元素(例如,日語等中的提示主語的“tt”)等。例如,也可以將eated分為作為表示實際含義的子單元部分“eat”和表示時態(tài)語法的子單元部分“ed”。
[0005]如圖1所示,在現(xiàn)有的翻譯產(chǎn)品中,例如,如果將鼠標放置在第二語言的語句的某個翻譯子單元上,則在第一語言的語句中以陰影的方法顯示對應的翻譯子單元。這種顯示方法存在如下問題,首先,必須通過鼠標等切換到顯示對應關(guān)系的模式,例如,在圖1所示例子中,需要將鼠標放置在某個子單元上,切換到顯示對應關(guān)系的模型,才顯示對應關(guān)系。如果鼠標不指示某個子單元,則不顯示兩種語言的子元素之間的對應關(guān)系。
[0006]此外,例如如圖1所示的例子那樣,只能一個一個地顯示對應關(guān)系。此外,不能顯示語序的變化,例如,英語是典型的主謂賓(SVO)語序,而日語是SOV語序,圖1所示的產(chǎn)品不能在第二語言中顯示出子單位原來的語序位置,必須參考左側(cè)的顯示才能掌握原來的語序位置。此外,不能在第二語言中顯示出已被隱藏的第一語言的語法元素等。例如,諸如bananas中的“s”表示復數(shù),而中文、日語等往往不使用復數(shù),因此,僅參照第二語言中的“八于于”,則無法知曉于于對應的是“bananas ”還是“ appIe ”。

【發(fā)明內(nèi)容】

[0007]針對上述問題,本發(fā)明提供一種計算機輔助翻譯方法,其由計算機執(zhí)行,其中,
[0008]所述計算機輔助翻譯方法包含如下處理:
[0009]預翻譯處理,將第一語言的語句中的各個翻譯子單元處理為第二語言的翻譯子單元,并對語序進行調(diào)整;
[0010]標記元素顯示處理,在通過所述預翻譯處理得到的作為第二語言的預翻譯結(jié)果中,在與所述第一語言的翻譯子單元相應的位置顯示標記元素;以及
[0011]標記元素清除處理,響應于用戶做出的用于清除標記元素的指示,將所述標記元素清除。
[0012]此外,可以是,在所述預翻譯處理中,使用基于模板的機器翻譯、基于規(guī)則的機器翻譯、基于統(tǒng)計的機器翻譯、基于實例的機器翻譯、基于詞典的簡單替代中的至少一種方式進行所述預翻譯。
[0013]此外,可以是,所述相應的位置包括調(diào)整語序之前的位置和調(diào)整語序之后的位置。
[0014]此外,可以是,所述標記元素為字符或圖片。
[0015]通過以上方式,可以在作為第二語言的翻譯結(jié)果中,直觀地表現(xiàn)出第二語言的子單元與第一語言的子單元之間的對應關(guān)系。
【附圖說明】
[0016]圖1示出了用于說明現(xiàn)有的翻譯產(chǎn)品中顯示對應關(guān)系的例子。
[0017]圖2示出了輔助翻譯程序P的組成結(jié)構(gòu)。
[0018]圖3不出了翻譯模板的例子。
[0019]圖4示出了與翻譯模板對應的標記模板的例子。
[0020]圖5示出了顯示有標記元素的翻譯結(jié)果的例子。
[0021]圖6不出了與辭典對應的標記模板的例子。
【具體實施方式】
[0022]本發(fā)明的計算機輔助翻譯方法例如可由作為個人計算機的PCl執(zhí)行輔助翻譯程序P來實現(xiàn)。PCl可以是通常的個人計算機,其具有處理器、存儲器、顯示器和鼠標鍵盤等,可執(zhí)行輔助翻譯程序P,進行翻譯處理。輔助翻譯程序P構(gòu)成為包括預翻譯模塊P1、標記元素顯示模塊P2和標記元素清除模塊P3。
[0023]例如,用戶通過鍵盤或鼠標指示輔助翻譯程序P進行翻譯處理。響應于該指示,在預翻譯模塊Pl中,針對待翻譯的第一語言的語句,基于現(xiàn)有的翻譯方法進行預翻譯。在預翻譯中,將第一語言的語句中的各個翻譯子單元處理為第二語言的翻譯子單元,并對對語序進彳丁調(diào)整。
[0024]例如,可以采用基于模板的機器翻譯(TBMT)技術(shù)來進行預翻譯。在基于模板的機器翻譯中,例如,如圖3所示,在翻譯模板庫中存在諸如“I like[A]—私?; [Α]汾好吞T才”這樣的翻譯模板,其表示將“I like [A]”翻譯為“私?; [Α]系好吞7才”。例如,針對“Ilike apple”、“I like orange”這樣的待翻譯語句,在預翻譯模塊Pl中,針對模板中[A]的部分,通過查找辭典等方法,將[A]處的第一語言的子單元置換為第二語言的子單元,SP,將“apple”置換為“卩> =T ”,將“orange”置換為“才U V P ”,并與模板中的其他部分相結(jié)合,從而將 “I like apple,,、“I like orange” 翻譯為“私ii; 1J V ?好 ? "?、才”、“私才U V夕汾好吞T才”。
[0025]以上,使用了 TBMT技術(shù)來進行預翻譯,但不限于此,也可以通過其他方法來進行預翻譯。例如,可以采用基于規(guī)則的機器翻譯技術(shù)來進行預翻譯。類似地,與存儲翻譯規(guī)則的庫中的各個翻譯規(guī)則對應地建立標記模板,針對基于規(guī)則的預翻譯結(jié)果顯示標記元素。
[0026]在標記元素顯示模塊Ρ2中,針對預翻譯的結(jié)果,顯示標記元素。例如,可以利用助標記元素庫來顯示標記元素。標記元素庫例如可由文本文件實現(xiàn),在標記元素庫中,存在“I like[A]—私<like>[A]汾好g T才〈like〉”這樣的標記模板。該標記模板分為三部分:左側(cè)為模板的名稱,其可作為鍵來唯一標識模板;中間部分用于顯示標記元素;右側(cè)用于在后述處理中清除標記元素,在要清除的標記元素存在多個的情況下,例如可以使用“ I ”等分隔符分隔各個標記兀素。
[0027]例如,可以通過左側(cè)的名稱進行檢索。例如,根據(jù)“I like[A]”檢索與“I like[A]^對應的標記元素的模板,得到“私<like>[A]汾好g T才”。其中,“私<like>[A]汾〈好吞T才〉”中的“ <> ”表示在該位置顯示標記元素。
[0028]這樣,如圖5所示,通過標記元素顯示模塊P2顯示標記元素,“I like apple”的翻譯結(jié)果為“私like y y =T尕好答”。由此,在作為第二語言的翻譯結(jié)果中,分別在翻譯子單元被調(diào)整語序之前的位置和被調(diào)整語序之后的位置顯示標記元素,使得用戶可以直觀地在翻譯結(jié)果中掌握發(fā)生語序變換的字段與翻譯之前的字段元之間的對應關(guān)系和相對位置。類似地,對于which之類的帶有從句的復雜長句,在翻譯時通常根據(jù)情況拆分成容易理解的短句。例如,通過在作為第二語言的翻譯結(jié)果中的原來的Which的位置嵌入式地顯示標記元素,可以使得用戶容易理解原有的句子結(jié)構(gòu)而方便地進行修改。
[0029]在該例子中,使用了與其它部分不同的粗斜體來顯示標記元素,但在實際應用中,可以用顏色、下劃線、字體大小等其他方式來標記元素,只要使得用戶通過顯示方式而容易分辨出標記元素以及容易判斷出子單元之間的對應關(guān)系即可。
[0030
當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1