鬼佬大哥大
  • / 9
  • 下載費用:30 金幣  

計算機輔助翻譯方法.pdf

摘要
申請專利號:

CN201510627948.4

申請日:

2015.09.28

公開號:

CN105069001A

公開日:

2015.11.18

當前法律狀態:

撤回

有效性:

無權

法律詳情: 發明專利申請公布后的視為撤回IPC(主分類):G06F 17/28申請公布日:20151118|||公開
IPC分類號: G06F17/28 主分類號: G06F17/28
申請人: 張云鵬
發明人: 不公告發明人
地址: 100191北京市海淀區北土城西路塔院小區迎春園11-507
優先權: 201510357332X 2015.06.22 CN
專利代理機構: 代理人:
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510627948.4

授權公告號:

|||

法律狀態公告日:

2019.01.04|||2015.11.18

法律狀態類型:

發明專利申請公布后的視為撤回|||公開

摘要

一種計算機輔助翻譯方法,其由計算機執行,其中,所述計算機輔助翻譯方法包含如下處理:預翻譯處理,將第一語言的語句中的各個翻譯子單元處理為第二語言的翻譯子單元,并對語序進行調整;標記元素顯示處理,在通過所述預翻譯處理得到的作為第二語言的預翻譯結果中,在與所述第一語言的翻譯子單元相應的位置顯示標記元素;以及標記元素清除處理,響應于用戶做出的用于清除標記元素的指示,將所述標記元素清除。由此,可使用戶便于識別第一語言和第二語言的對應關系。

權利要求書

1.一種計算機輔助翻譯方法,其由計算機執行,其中,
所述計算機輔助翻譯方法包含如下處理:
預翻譯處理,將第一語言的待翻譯語句中的各個翻譯子單元處理為第二語言的
翻譯子單元,并對語序進行調整;
標記元素顯示處理,在通過所述預翻譯處理得到的作為第二語言的預翻譯結果
中,在與所述第一語言的翻譯子單元相應的位置顯示標記元素;以及
標記元素清除處理,響應于用戶做出的用于清除標記元素的指示,將所述標記
元素清除。
2.根據權利要求1所述的計算機輔助翻譯方法,其中,
所述相應的位置包括調整語序之前的位置和調整語序之后的位置。
3.根據權利要求1所述的計算機輔助翻譯方法,其中,
在所述預翻譯處理中,使用基于模板的機器翻譯、基于規則的機器翻譯、基于
統計的機器翻譯、基于實例的機器翻譯、基于詞典的簡單替代中的至少一種方式進行
所述預翻譯。
4.根據權利要求1或2所述的計算機輔助翻譯方法,其中,
所述標記元素為字符或圖片。

說明書

計算機輔助翻譯方法

技術領域

本發明涉及計算機輔助翻譯(computeraidedtranslation,CAT)方法。

背景技術

目前,基于計算機實現的機器翻譯(MT)技術有可分為基于規則的機器翻譯
(RBMT)、基于統計的機器翻譯(SMT)、基于實例的機器翻譯(EBMT)、基于模
板的機器翻譯(TBMT)的機器翻譯技術等。另外,還存在以翻譯記憶(translation
memory,TM)技術為代表的計算機輔助翻譯技術。

無論是機器翻譯還是計算機輔助翻譯,都是將待翻譯語言(以下,有時記作第
一語言)的語句翻譯成目標語言(以下,有時記作第二語言)的語句。但在目前的計
算機翻譯(包括計算機機器翻譯和計算機輔助翻譯)產品中,在第一語言和第二語言
之間的對應關系的顯示方面存在許多問題。

例如,如圖1所示,第一語言位于左側,作為翻譯結果的第二語言位于右側。
它們分別由多個翻譯子單元(以下有時簡稱做子單元)構成。所謂翻譯子單元是指句
子的各個組成部分,它們可大體分類為具有實際含義的詞匯以及僅表示語法信息的元
素(例如,日語等中的提示主語的“は”)等。例如,也可以將eated分為作為表示實
際含義的子單元部分“eat”和表示時態語法的子單元部分“ed”。

如圖1所示,在現有的翻譯產品中,例如,如果將鼠標放置在第二語言的語句
的某個翻譯子單元上,則在第一語言的語句中以陰影的方法顯示對應的翻譯子單元。
這種顯示方法存在如下問題,首先,必須通過鼠標等切換到顯示對應關系的模式,例
如,在圖1所示例子中,需要將鼠標放置在某個子單元上,切換到顯示對應關系的模
型,才顯示對應關系。如果鼠標不指示某個子單元,則不顯示兩種語言的子元素之間
的對應關系。

此外,例如如圖1所示的例子那樣,只能一個一個地顯示對應關系。此外,不
能顯示語序的變化,例如,英語是典型的主謂賓(SVO)語序,而日語是SOV語序,
圖1所示的產品不能在第二語言中顯示出子單位原來的語序位置,必須參考左側的顯
示才能掌握原來的語序位置。此外,不能在第二語言中顯示出已被隱藏的第一語言的
語法元素等。例如,諸如bananas中的“s”表示復數,而中文、日語等往往不使用復
數,因此,僅參照第二語言中的“バナナ”,則無法知曉バナナ對應的是“bananas”
還是“apple”。

發明內容

針對上述問題,本發明提供一種計算機輔助翻譯方法,其由計算機執行,其中,

所述計算機輔助翻譯方法包含如下處理:

預翻譯處理,將第一語言的語句中的各個翻譯子單元處理為第二語言的翻譯子
單元,并對語序進行調整;

標記元素顯示處理,在通過所述預翻譯處理得到的作為第二語言的預翻譯結果
中,在與所述第一語言的翻譯子單元相應的位置顯示標記元素;以及

標記元素清除處理,響應于用戶做出的用于清除標記元素的指示,將所述標記
元素清除。

此外,可以是,在所述預翻譯處理中,使用基于模板的機器翻譯、基于規則的
機器翻譯、基于統計的機器翻譯、基于實例的機器翻譯、基于詞典的簡單替代中的至
少一種方式進行所述預翻譯。

此外,可以是,所述相應的位置包括調整語序之前的位置和調整語序之后的位
置。

此外,可以是,所述標記元素為字符或圖片。

通過以上方式,可以在作為第二語言的翻譯結果中,直觀地表現出第二語言的
子單元與第一語言的子單元之間的對應關系。

附圖說明

圖1示出了用于說明現有的翻譯產品中顯示對應關系的例子。

圖2示出了輔助翻譯程序P的組成結構。

圖3示出了翻譯模板的例子。

圖4示出了與翻譯模板對應的標記模板的例子。

圖5示出了顯示有標記元素的翻譯結果的例子。

圖6示出了與辭典對應的標記模板的例子。

具體實施方式

本發明的計算機輔助翻譯方法例如可由作為個人計算機的PC1執行輔助翻譯程
序P來實現。PC1可以是通常的個人計算機,其具有處理器、存儲器、顯示器和鼠標
鍵盤等,可執行輔助翻譯程序P,進行翻譯處理。輔助翻譯程序P構成為包括預翻譯
模塊P1、標記元素顯示模塊P2和標記元素清除模塊P3。

例如,用戶通過鍵盤或鼠標指示輔助翻譯程序P進行翻譯處理。響應于該指示,
在預翻譯模塊P1中,針對待翻譯的第一語言的語句,基于現有的翻譯方法進行預翻
譯。在預翻譯中,將第一語言的語句中的各個翻譯子單元處理為第二語言的翻譯子單
元,并對對語序進行調整。

例如,可以采用基于模板的機器翻譯(TBMT)技術來進行預翻譯。在基于模
板的機器翻譯中,例如,如圖3所示,在翻譯模板庫中存在諸如“Ilike[A]→私は[A]
が好きです”這樣的翻譯模板,其表示將“Ilike[A]”翻譯為“私は[A]が好きです”。例
如,針對“Ilikeapple”、“Ilikeorange”這樣的待翻譯語句,在預翻譯模塊P1中,針對
模板中[A]的部分,通過查找辭典等方法,將[A]處的第一語言的子單元置換為第二語
言的子單元,即,將“apple”置換為“リンゴ”,將“orange”置換為“オレンジ”,并與模
板中的其他部分相結合,從而將“Ilikeapple”、“Ilikeorange”翻譯為“私はリンゴが好
きです”、“私はオレンジが好きです”。

以上,使用了TBMT技術來進行預翻譯,但不限于此,也可以通過其他方法來
進行預翻譯。例如,可以采用基于規則的機器翻譯技術來進行預翻譯。類似地,與存
儲翻譯規則的庫中的各個翻譯規則對應地建立標記模板,針對基于規則的預翻譯結果
顯示標記元素。

在標記元素顯示模塊P2中,針對預翻譯的結果,顯示標記元素。例如,可以利
用助標記元素庫來顯示標記元素。標記元素庫例如可由文本文件實現,在標記元素庫
中,存在“Ilike[A]→私は<like>[A]が好きです<like>”這樣的標記模板。該標記模
板分為三部分:左側為模板的名稱,其可作為鍵來唯一標識模板;中間部分用于顯示
標記元素;右側用于在后述處理中清除標記元素,在要清除的標記元素存在多個的情
況下,例如可以使用“|”等分隔符分隔各個標記元素。

例如,可以通過左側的名稱進行檢索。例如,根據“Ilike[A]”檢索與“Ilike[A]”
對應的標記元素的模板,得到“私は<like>[A]が好きです”。其中,“私は<like>[A]が<
好きです>”中的“<>”表示在該位置顯示標記元素。

這樣,如圖5所示,通過標記元素顯示模塊P2顯示標記元素,“Ilikeapple”的
翻譯結果為“私はlikeリンゴが好きです”。由此,在作為第二語言的翻譯結果中,分
別在翻譯子單元被調整語序之前的位置和被調整語序之后的位置顯示標記元素,使得
用戶可以直觀地在翻譯結果中掌握發生語序變換的字段與翻譯之前的字段元之間的
對應關系和相對位置。類似地,對于which之類的帶有從句的復雜長句,在翻譯時通
常根據情況拆分成容易理解的短句。例如,通過在作為第二語言的翻譯結果中的原來
的which的位置嵌入式地顯示標記元素,可以使得用戶容易理解原有的句子結構而方
便地進行修改。

在該例子中,使用了與其它部分不同的粗斜體來顯示標記元素,但在實際應用
中,可以用顏色、下劃線、字體大小等其他方式來標記元素,只要使得用戶通過顯示
方式而容易分辨出標記元素以及容易判斷出子單元之間的對應關系即可。

此外,在標記元素顯示模塊P2中,可以將關于需要清除的標記元素的信息(例
如文本內容、字體、是否為圖片顯示方式等信息)臨時記錄在例如內存中,以便于在
后續處理中清除標記元素直接訪問內存,即可得到關于待清除的標記元素的信息,從
而根據這些信息將標記元素與翻譯結果區分開,來清除標記元素,保留翻譯結果。

也可以采用同樣的方法來顯示其他語言信息。例如,英語等印歐語系的語言往
往具有單復數形式,而中文、日文通常不使用復數。為了便于在作為翻譯結果的第二
語言的語句中直觀地顯示第一語言的單復數等語言信息。例如,針對在圖3所示的“I
like[A]→私は[A]が好きです”這樣的翻譯模板中的使用辭典來進行處理的[A]的部
分,定義圖6所示“applesリンゴ<s><s>”、“bananasバナナ<s><s>”這樣的顯示
標記元素的模板。與以上說明類似地,該標記模板分為三部分:左側為模板的鍵;中
間部分用于顯示標記元素;右側用于在后述處理中清除標記元素。

由此,通過標記元素顯示模塊P2顯示這樣的標記元素,例如,將“bananas”處
理為“バナナs”,這使得用戶可以在作為翻譯結果的第二語言的語句中,直觀地看到
在以往的翻譯產品中無法看到的對應關系,以及已經被隱藏或清除的語法元素(例如,
單復數、時態、陰性陽性等),從而使得用戶可以基于這些元素方便地對翻譯結果進
行修正。

如果用戶對翻譯結果滿意,可通過鍵盤或鼠標等指示輔助翻譯程序P清除標記
元素。例如,可以對“清除標記元素”的操作分配快捷鍵F8。在用戶按下F8時,響應
于用戶作出的指示,在標記元素清除模塊P3中,針對上述標記模板中的需要清除的
標記元素的部分,例如基于在標記元素顯示模塊P2中記錄在內存中的與待清除的標
記元素的內容或顯示方式等相關的信息,將翻譯結果中的標記元素清除。

例如,在圖5所示的例子中,“like”和“好きです”通過粗斜體的顯示方式來發揮
標記元素的作用,在標記元素清除處理中,“like”部分為單純的標記元素,因而被直
接刪除。作為翻譯結果的“好きです”通過粗斜體的顯示方式兼有標記元素的作用,因
而在清除“粗斜體的顯示方式”后被作為翻譯結果保留。由此,最終得到清除了標記元
素的翻譯結果。

此外,還可以在標記模板文件中,增加用于規定如何顯示標記元素的一列,例
如,可以規定顯示的字體的顏色、大小等,由此,用戶可以通過編輯標記模板,改變
為自己喜歡的顯示方式。

此外,標記元素是通過調整文本的顯示方式(字體顏色等)來實現的,但也可
以采用圖片的方式進行顯示,例如,將“eat”轉換為顯示有“eat”的圖片。在該情況下,
在清除標記元素時,針對圖5所示的“好きです”這樣的兼用作標記元素的部分,需要
將其圖片內容轉換為文本,以在最后結果中保留其文本內容。

此外,在建立標記模板時,針對諸如發生語序變換這樣的成對的標記元素,除
了字體、顏色等方式以外,優選在標記元素中體現出語義的對應關系。例如,在與“好
き”對應的標記元素中,優選采用“like”這樣的表現方式來對應語義的顯示方式。

此外,以上說明了通過顯示方式等來使用戶容易借助標記元素來識別第二語言
和第一語言的關系,但這不是必須的,例如也采用類似于上述采用“like”這樣的表現
方式來對應語義的顯示方式。例如,在根據“bananasバナナ<s><s>”這樣的模板將
bananas通過替代等方式處理為“バナナs”,由于用戶可容易地區分“バナナs”中的“s”
起到的標記復數的作用,因此,也可以不改變其字體、顏色等顯示方式。

以上翻譯模板庫和標記模板庫僅為示例,模板的各個部分的排列順序、“<>”等
符號僅為示例,在實現時可以采用其它形式。例如,可以將“bananasバナナ<s><s>”
拆分成“bananasバナナ<s>”和“bananas<s>”等。例如,可以采用“[]”,從而成為
“bananasバナナ[s][s]”。或者,在模板中去掉用其它符號來提替代“<>”或者直
接省略。例如,可以將“bananasバナナ<s><s>”拆分成“bananasバナナs”和“bananas
s”等。例如在將模板拆分為兩個的情況下,在使用時可以將兩個模板以“bananas”為
鍵結合起來,基于結合后的模板的處理方式與以上說明的方法相同,在此省略說明。

通過以上方式,與現有的同時顯示第一語言的帶翻譯語句和第二語言的翻譯結
果的現有方式相比,可以在作為第二語言的翻譯結果中,直觀地表現出第二語言的子
單元與第一語言的子單元之間的對應關系。

變形例1

此外,在以上說明中,在預翻譯模塊P1中,基于模板的機器翻譯技術來進行預
翻譯,但也可以使用基于規則的機器翻譯、基于統計的機器翻譯、基于實例的機器翻
譯、基于詞典的簡單替代等進行預翻譯,或者組合它們中的一種以上的方式來進行預
翻譯。

關于基于模板的機器翻譯技術、基于規則的機器翻譯、基于統計的機器翻譯、
基于實例的機器翻譯,由于為現有技術,在此不再進行詳細說明。所謂基于詞典的簡
單替代,例如可通過如下方式進行:在詞典中查找與第一語言對應的第二英語的詞匯,
將第一語言的詞匯替代為第二語言的詞匯。例如,在將“Ilikeyou”翻譯成漢語時,
通過查找詞典,分別查找詞典,將各個詞匯替代為漢語“我喜歡你”。

變形例2

此外,上面以個人計算機來進行了說明,但也可以使該計算機可以與網絡連接,
例如通過云計算的方式對所述輔助翻譯程序進行分散部署。

以上通過實施方式和變形例對本發明進行了說明,但是不言而喻,在不脫離本
發明的技術范圍內,可增加其他技術方案。

產業應用

本發明可以應用于計算機輔助翻譯方法等。

關 鍵 詞:
計算機輔助 翻譯 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:計算機輔助翻譯方法.pdf
鏈接地址:http://www.wwszu.club/p-6386014.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大