鬼佬大哥大
  • / 16
  • 下載費用:30 金幣  

詞匯的獲取方法及裝置、推送方法及裝置.pdf

摘要
申請專利號:

CN201510454758.7

申請日:

2015.07.29

公開號:

CN105069064A

公開日:

2015.11.18

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 17/30申請日:20150729|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 百度在線網絡技術(北京)有限公司
發明人: 李鵬程; 王軼翔
地址: 100085北京市海淀區上地十街10號百度大廈
優先權:
專利代理機構: 北京鴻德海業知識產權代理事務所(普通合伙)11412 代理人: 袁媛
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510454758.7

授權公告號:

||||||

法律狀態公告日:

2019.04.30|||2015.12.16|||2015.11.18

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本發明實施例提供了一種詞匯的獲取方法及裝置、推送方法及裝置。一方面,本發明實施例通過獲取用戶的興趣分布信息;從而,生成個性化詞庫,所述個性化詞庫包含基礎詞匯和新詞;進而,根據所述用戶的興趣分布信息和所述個性化詞庫,獲得針對所述用戶的個性化詞匯。因此,本發明實施例提供的技術方案用以解決輸入法詞匯無法滿足用戶的個性化輸入需求的問題。

權利要求書

1.一種詞匯的獲取方法,其特征在于,所述方法包括:
獲取用戶的興趣分布信息;
生成個性化詞庫,所述個性化詞庫包含基礎詞匯和新詞;
根據所述用戶的興趣分布信息和所述個性化詞庫,獲得針對所述用戶的個性
化詞匯。
2.根據權利要求1所述的方法,其特征在于,所述生成個性化詞庫,包括:
根據已有詞庫,獲取所述基礎詞匯;
根據熱門詞匯和時效性詞匯,獲取所述新詞;
根據所述基礎詞匯和所述新詞,生成所述個性化詞庫。
3.根據權利要求2所述的方法,其特征在于,所述根據熱門詞匯和時效性
詞匯,獲取所述新詞之前,所述方法還包括:
獲取時效性的頁面內容;
對所述時效性的頁面內容進行切詞處理,以獲得至少一個候選詞匯;
根據用戶輸入詞匯歷史記錄和每個候選詞匯的標簽,對所述至少一個候選詞
匯進行篩選,以獲得所述時效性詞匯。
4.根據權利要求1或2所述的方法,其特征在于,所述用戶的興趣分布信
息包括所述用戶的至少一個興趣標簽以及每個所述興趣標簽的權重值;所述根據
所述用戶的興趣分布信息和所述個性化詞庫,獲得針對所述用戶的個性化詞匯,
包括:
根據預設的詞匯總數和每個所述興趣標簽的權重值,確定每個所述興趣標簽
對應的個性化詞匯數目;
根據每個所述興趣標簽和每個所述興趣標簽對應的個性化詞匯數目,從所述
個性化詞庫獲得每個所述興趣標簽對應的個性化詞匯,以作為針對所述用戶的個
性化詞匯。
5.一種詞匯的推送方法,其特征在于,所述方法包括:
接收客戶端發送的詞匯版本信息和用戶標識;
根據所述詞匯版本信息和所述用戶標識,獲得針對使用所述客戶端的用戶的
個性化詞匯;所述針對使用所述客戶端的用戶的個性化詞匯為利用權利要求1至
4中任一權利要求所述的詞匯的獲取方法獲取的;
將針對使用所述客戶端的用戶的個性化詞匯推送給所述客戶端。
6.根據權利要求5所述的方法,其特征在于,所述根據所述詞匯版本信息
和所述用戶標識,獲得針對使用所述客戶端的用戶的個性化詞匯,包括:
根據所述用戶標識,獲得最新的詞匯版本信息;
將所述最新的詞匯版本信息與從所述客戶端接收的詞匯版本信息進行比較,
若兩個詞匯版本信息不一致,根據所述用戶標識,獲得針對使用所述客戶端的用
戶的個性化詞匯。
7.一種詞匯的獲取裝置,其特征在于,所述裝置包括:
興趣獲取單元,用于獲取用戶的興趣分布信息;
詞庫生成單元,用于生成個性化詞庫,所述個性化詞庫包含基礎詞匯和新詞;
詞匯獲取單元,用于根據所述用戶的興趣分布信息和所述個性化詞庫,獲得
針對所述用戶的個性化詞匯。
8.根據權利要求7所述的裝置,其特征在于,所述詞庫生成單元,具體用
于:
根據已有詞庫,獲取所述基礎詞匯;
根據熱門詞匯和時效性詞匯,獲取所述新詞;
根據所述基礎詞匯和所述新詞,生成所述個性化詞庫。
9.根據權利要求8所述的裝置,其特征在于,所述詞庫生成單元,還用于:
獲取時效性的頁面內容;
對所述時效性的頁面內容進行切詞處理,以獲得至少一個候選詞匯;
根據用戶輸入詞匯歷史記錄和每個候選詞匯的標簽,對所述至少一個候選詞
匯進行篩選,以獲得所述時效性詞匯。
10.根據權利要求7或8所述的裝置,其特征在于,所述用戶的興趣分布信
息包括所述用戶的至少一個興趣標簽以及每個所述興趣標簽的權重值;所述詞匯
獲取單元,具體用于:
根據預設的詞匯總數和每個所述興趣標簽的權重值,確定每個所述興趣標簽
對應的個性化詞匯數目;
根據每個所述興趣標簽和每個所述興趣標簽對應的個性化詞匯數目,從所述
個性化詞庫獲得每個所述興趣標簽對應的個性化詞匯,以作為針對所述用戶的個
性化詞匯。
11.一種詞匯的推送裝置,其特征在于,所述裝置包括:
信息輸入單元,用于接收客戶端發送的詞匯版本信息和用戶標識;
詞匯處理單元,用于根據所述詞匯版本信息和所述用戶標識,獲得針對使用
所述客戶端的用戶的個性化詞匯;所述針對使用所述客戶端的用戶的個性化詞匯
為利用權利要求7至10中任一權利要求所述的詞匯的獲取裝置獲取的;
信息輸出單元,用于將針對使用所述客戶端的用戶的個性化詞匯推送給所述
客戶端。
12.根據權利要求11所述的裝置,其特征在于,所述詞匯處理單元,具體
用于:
根據所述用戶標識,獲得最新的詞匯版本信息;
將所述最新的詞匯版本信息與從所述客戶端接收的詞匯版本信息進行比較,
若兩個詞匯版本信息不一致,根據所述用戶標識,獲得針對使用所述客戶端的用
戶的個性化詞匯。

關 鍵 詞:
詞匯 獲取 方法 裝置 推送
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:詞匯的獲取方法及裝置、推送方法及裝置.pdf
鏈接地址:http://www.wwszu.club/p-6386063.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大