鬼佬大哥大
  • / 15
  • 下載費用:30 金幣  

人機交互的分詞與語義標示的方法與系統.pdf

關 鍵 詞:
人機交互 分詞 語義 標示 方法 系統
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
摘要
申請專利號:

CN201410080020.4

申請日:

2014.03.06

公開號:

CN104899187A

公開日:

2015.09.09

當前法律狀態:

撤回

有效性:

無權

法律詳情: 發明專利申請公布后的視為撤回IPC(主分類):G06F 17/27申請公布日:20150909|||公開
IPC分類號: G06F17/27; G06F3/0481(2013.01)I 主分類號: G06F17/27
申請人: 武漢元寶創意科技有限公司
發明人: 蔡天琪; 陳竹心; 王墅; 陳澤昊; 徐家輝; 蔡恒進
地址: 430000湖北省武漢市武昌區八一路115號珞珈科技信息產業園2棟1004室
優先權:
專利代理機構: 代理人:
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201410080020.4

授權公告號:

|||

法律狀態公告日:

2017.10.27|||2015.09.09

法律狀態類型:

發明專利申請公布后的視為撤回|||公開

摘要

本發明公布了人機交互的分詞與語義標示的方法,其中包括:接收文檔輸入,默認分詞;收到指示人工進行分詞增加刪除調整;進行人工設置代詞或省略的指向和對二義性語句進行釋義輸入;最后接收、顯示并保存用戶的更新操作。本發現還公布了人機交互的分詞與語義標示的系統,系統包括獲取輸入模塊、分詞處理模塊、指代設置模塊及顯示模塊。

權利要求書

權利要求書
1.  人機交互的分詞與語義標示的方法,包括:
A、接收輸入,默認分詞
B、收到指示進行人工分詞調整
C、收到指示進行人工設置代詞或省略的指向
D、收到指示對于二義性語句進行釋義輸入
E、接收、顯示并保存用戶的更新操作。

2.  根據權利要求1所述的方法,其特征在于:人機交互入口為在分詞過程中收到的用戶指示操作。

3.  根據權利要求1所述的方法,其特征在于,所述的A步驟包括:
根據輸入的文本,以詞庫為依據進行匹配,將識別出的詞匯與其他未識別部分進行標記,達到視覺上的區分;區分呈現的方式包括但不限于使用下劃線標記出識別的部分,或采用豎線、斜線等符號進行分隔。

4.  根據權利要求3所述的方法,其特征在于:
詞匯的匹配方式包括但不限于使用正向迭代匹配,即正序逐字識別、與詞庫進行比對,一般默認采用正向最大長度匹配原則并進行詞頻統計。

5.  根據權利要求1所述的方法,其特征在于,所述的B步驟包括:
接收到的人工分詞指示包括刪除默認識別標記和添加新的識別標記,分詞的詞匯頻率統計將在每一次對詞匯識別的人工操作后進行更新。

6.  根據權利要求1所述的方法,其特征在于,所述的C步驟包括:
接收到的指示為定義指代指示;將識別光標在GUI中接近的文本作為使用了指代或省略的對象,提供至少一種對象選項;接收用戶確認的指代或省略對象;提供至少一種指代或省略的具體內容選項;接收用戶確認的指代或省略的具體內容。

7.  根據權利要求6所述的方法,其特征在于:
用戶確認指代或省略對象、指代或省略具體內容的方式包括但不限于在提供的單選列表中進行選擇或手動輸入。

8.  根據權利要求1所述的方法,其特征在于,所述的D步驟包括:
接收到的指示為二義性指示;對于有二義性的語句,接收用戶的自定義輸入釋義。

9.  根據權利要求1所述的方法,其特征在于,所述的E步驟包括:
分詞結果、代詞或省略指代和二義性等信息隨著源文件一起保存,包括但不限于使用插件或通過格式文件存儲;保存的方式包括但不限于本地保存和保存到互聯網或云端。

10.  本發現還公布了人機交互的分詞與語義標示的系統,系統包括獲取輸入模塊、分詞處理模塊、指代設置模塊及顯示模塊:
獲取輸入模塊接收文檔的輸入;分詞處理模塊對文檔進行初步處理,與數據庫進行匹配,進行分詞;指代設著模塊包括對文檔指代不明及省略部分提供指代選擇與接收用戶的選擇及輸入,還包括接收用戶對二義性語句的輸入釋義;顯示模塊處理對分詞結果的顯示。

說明書

說明書人機交互的分詞與語義標示的方法與系統
技術領域
本發明涉及自然語言處理技術,特別涉及人機交互的分詞與語義標示的方法。
背景技術
作為自然語言的中文有著悠久的歷史,古文是沒有標點符號的,標點的使用讓中文更加易于理解。同樣分詞在自然語言處理相關的應用中是非常重要的,分詞的結果將直接影響到具體應用的效果。
分詞技術在近年來受到了人們的廣泛關注。所謂分詞,就是將文字序列切分成一個一個單獨的詞。以中文分詞技術為例,分詞技術的目標就是將例如但不限于一句話切分為一個一個單獨的中文詞語。
而將文字序列切分為單獨的詞,是實現機器識別人類語言的第一步,因此分詞技術至關重要。經過多年的發展,研究人員已先后開發出多種分詞方法,包括例如但不限于基于字符串匹配的分詞方法、基于理解的分詞方法和基于統計的分詞方法等等。
分詞過程中還存在一定的歧義現象。歧義指的是在分詞過程中存在多種切分選擇的情況,在分詞過程中如果出現歧義,現有技術中難以為消除歧義提供依據。容易得出使得機器理解自然語言,完全的自動化在當前背景下不現實,需要使用交互的方式進行。語義上的不確定性,使得作者與讀者的理解有偏差,特別地,在法律文件中,不應存在模糊性。在這種情況下,人機交互的分詞與語義標示的方法存在十分必要。
發明內容
本發明提供了人機交互的分詞與語義標示的方法,可以對文檔進行分詞、詞頻統計、消除二義性和對代詞或省略指代等信息進行處理。
該方法首先接收文檔輸入,默認進行分詞處理,用戶可以選擇確認分詞或進行人工干預。
系統收到進行人工分詞調整的指示包括增加和刪除兩種操作。
其中接收到增加分詞指示,提示用戶選中詞語,根據用戶的光標,高亮標記出的詞語,鼠標再一次松開后,詞語標記完成,添加分詞符號。
而接收到刪除指示,提示用戶選中詞語,根據用戶的光標,刪去原分詞符號,將原分詞與前后文合并。
除了進行分詞的調整還收到指示進行人工設置代詞或省略的指向。
用戶可操作光標定位在接近的計算機設備顯示設備上的圖形用戶界面(GUI)中,系統收到指示進行人工指向提供至少一種指向選項和用戶自定義輸入框,用戶進行輸入選擇,系統接收用戶輸入的GUI選擇或自定義輸入。
在光標再次移動到該詞條上時,顯示出更新后的指代或省略信息。
對于有二義性的語句,系統提供用戶自定義輸入框,由用戶進行選擇輸入,系統進行更新保存。
本發現還公布了人機交互的分詞與語義標示的系統,系統包括獲取輸入模塊、分詞處理模塊、指代設置模塊及顯示模塊。
獲取輸入模塊接收文檔的輸入;分詞處理模塊對文檔進行初步處理,與數據庫進行匹配,進行分詞;指代設著模塊包括對文檔指代不明及省略部分提供指代選擇與接收用戶的選擇及輸入,還包括接收用戶對二義性語句的輸入釋義;顯示模塊處理對分詞結果的顯示。
附圖說明
 圖1是用來呈現人機交互的分詞與語義標示的方法的流程圖。
圖2是人機交互的分詞與語義標示的系統對分詞結果呈現的示意圖。
圖3是刪除系統分詞示意圖。
圖4是添加系統分詞示意圖。
圖5是用來呈現人機交互的分詞與語義標示的系統對指代設置示意圖。
圖6是用來呈現人機交互的分詞與語義標示的系統對指代選擇示意圖。
圖7是用來呈現人機交互的分詞與語義標示的系統對指代自定義輸入示意圖。
圖8是用來呈現人機交互的分詞與語義標示的系統對語句二義性處理示意圖。
圖9是用來呈現人機交互的分詞與語義標示的系統對語句二義性用戶輸入示意圖。
圖10是人機交互的分詞與語義標示的系統模塊圖。
具體實施方式
圖1是用來呈現人機交互的分詞與語義標示的方法的流程圖。
該方法從101開始,首先接收文檔輸入,102根據用戶輸入和默認詞典進行初始化分詞,識別的詞語用分詞符號進行標記。
之后用戶可以選擇確認分詞或進行人工干預。
如用戶不進行人工干預,則通過113步驟達到114結束。如用戶進行103手動調整,則可以選擇104分詞調整或者108指代及二義調整。
系統105接受分詞調整包括增加和刪除兩種操作。
106設置分詞符號,如接收到增加分詞指示,提示用戶選中詞語,根據用戶的光標,高亮標記出的詞語,鼠標再一次松開后,詞語標記完成,添加分詞符號。
而接收到刪除指示,提示用戶選中詞語,根據用戶的光標,刪去原分詞符號,將原分詞與前后文合并。107進行整合上下文。
除了進行分詞的調整還收到指示進行人工設置代詞或省略的指向。
109接受人工指向指示,用戶可操作光標定位在接近的計算機設備顯示設備上的圖形用戶界面(GUI)中,110系統收到指示進行人工指向提供至少一種指向選項和用戶自定義輸入框,用戶進行輸入選擇,系統接收用戶輸入的GUI選擇或自定義輸入。
111接受用戶的選擇及輸入,在光標再次移動到該詞條上時,顯示出更新后的指代或省略信息。
對于有二義性的語句,110系統用戶自定義輸入框,111由用戶進行選擇輸入,進行112顯示并保存更新,最后114結束。
 
圖2是人機交互的分詞與語義標示的系統分詞結果呈現的示意圖,分詞結果如201古詩及202廣寒宮所示。
圖3是刪除系統分詞示意圖,用戶點擊301刪除分詞符進行刪除操作。
圖4是添加系統分詞示意圖,用戶使用光標指示選擇需要添加的分詞401,點擊添加分詞符402進行添加操作。
圖5是用來呈現人機交互的分詞與語義標示的系統對指代設置示意圖,用戶使用光標指示選擇需要進行指代設置的501,點擊指代設置502進行操作。
圖6是用來呈現人機交互的分詞與語義標示的系統對指代選擇示意圖,界面顯示指代選擇601月亮、廣寒宮闕及602自定義輸入。
圖7是用來呈現人機交互的分詞與語義標示的系統指代自定義輸入示意圖,在輸入框701中輸入指代內容。
圖8是用來呈現人機交互的分詞與語義標示的系統語句二義性處理示意圖801為選擇的有二義性的語句。
圖9是用來呈現人機交互的分詞與語義標示的系統語句二義性用戶輸入示意圖,901為二義性語句用戶自定義輸入框。
圖10是人機交互的分詞與語義標示的系統模塊圖,系統包括115獲取輸入模塊、116分詞處理模塊、117指代設置模塊及118顯示模塊。
115獲取輸入模塊接收文檔的輸入;116分詞處理模塊對文檔進行初步處理,與數據庫進行匹配,進行分詞;117指代設著模塊包括對文檔指代不明及省略部分提供指代選擇與接收用戶的選擇及輸入,還包括接收用戶對二義性語句的輸入釋義;118顯示模塊處理對分詞結果的顯示。

關于本文
本文標題:人機交互的分詞與語義標示的方法與系統.pdf
鏈接地址:http://www.wwszu.club/p-6369435.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大