鬼佬大哥大
  • / 7
  • 下載費用:30 金幣  

一種基于讀者層次的內容推送方法.pdf

摘要
申請專利號:

CN201510497841.2

申請日:

2015.08.14

公開號:

CN105069127A

公開日:

2015.11.18

當前法律狀態:

撤回

有效性:

無權

法律詳情: 發明專利申請公布后的視為撤回 IPC(主分類):G06F 17/30申請公布日:20151118|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 薛德軍; 梁晟
發明人: 薛德軍; 梁晟
地址: 100029北京市朝陽區安定路12號院國典華園1-602
優先權:
專利代理機構: 代理人:
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510497841.2

授權公告號:

|||

法律狀態公告日:

2019.03.12|||2015.11.18

法律狀態類型:

發明專利申請公布后的視為撤回|||公開

摘要

本發明旨在提出一種基于讀者層次的內容推送方法。該方法分為兩個階段:讀者層次模型訓練階段和內容推送階段。在訓練階段,根據應用領域,將讀者按水平或類型分層,得到讀者層次向量,制訂讀者層次推送策略,建立讀者層次模型,對讀者層次模型進行訓練,得到模型各維度參數向量的特征值。在推送階段,記錄讀者一定時期的實際操作信息,根據讀者所使用資源的元數據信息,計算出該讀者的層次參數向量,通過讀者層次模型進行機器學習,得到預測的讀者層次。讀者后續使用時,基于傳統的內容相似性比較以及讀者層次和推送策略,向讀者推送精準內容,不斷優化推送策略,提高讀者體驗。

權利要求書

1.一種基于讀者層次的內容推送方法,其特征在于,本方法分為讀者層次模型訓練階段
和推送階段,在訓練階段,對讀者按水平或類型分層,得到讀者層次向量,建設讀者層次模
型,并進行大規模數據訓練,得到模型各參數向量,在推送階段,根據讀者的實際操作信息,
進行機器學習,得到預測的讀者層次,讀者后續使用時,基于傳統的內容相似性比較以及讀
者層次和推送策略,向讀者推送精準內容,提高讀者體驗。
2.如權利要求1所述的方法,其特征在于,所述讀者層次向量是根據應用復雜性和資源
加工復雜性,對讀者群按水平或類型進行分層,分層數量由具體應用決定,得到讀者層次向
量,向量值為層次名稱或代碼。
3.如權利要求1所述的方法,其特征在于,所述讀者層次模型是記錄每一層次讀者對應
參數向量的數據結構,除讀者層次數據外,還包括:資源層次、資源類型、出版時間、語種、
其他信息共5類層次參數向量,這些維度上的值都來自對訓練集按常用訓練方法得到的訓練
結果,代表該層次讀者在這些方面的參數值。
4.如權利要求1、3所述的方法,其特征在于,所述常用訓練方法是指任何能夠從足夠訓
練數據集中得到一定結果的統計機器學習方法。
5.如權利要求1所述的方法,其特征在于,所述讀者實際操作信息是指讀者在一定時間
內學習使用過的內容資源列表,并根據這些資源對應的元數據信息,可以計算出讀者層次參
數向量,包括資源層次、資源類型、出版時間、語種、其他信息5類參數權重向量,權重可
以是頻次、比例或其他權重計算方法,需要進行統一的歸一化處理,保證向量計算和比較是
在同一度量上進行。
6.如權利要求1所述的方法,其特征在于,所述機器學習是基于讀者層次模型的知識,
采用多維度向量內積,加權求和,取最大值對應的讀者層次作為預測的讀者層次,計算公式
如下所示:
C = max i = 1 n Σ j = 1 5 k j · P j · C ij ]]>
其中:為當前讀者第j部分的層次參數向量,j從1到5代表共有5部分參數,包括
資源層次、資源類型、出版時間、語種、其他信息;
是指讀者層次模型中第i類讀者第j部分的參數向量,這些向量由訓練時確定;
kj是向量權重因子,
n為讀者層次數,C為n類讀者中層次向量權重最大類型對應的讀者層次號。
7.如權利要求1所述的方法,其特征在于,所述推送策略是指根據全體讀者的實際需求,
對每一層次讀者,設定的重點推送內容相似資源類型和數量,所推送資源都是經過內容相似
性計算后內容相似的部分資源,以保證推送的準確性和好的用戶體驗。

說明書

一種基于讀者層次的內容推送方法

技術領域

本發明涉及在線教育、文獻檢索信息服務領域。

背景技術

目前,網絡信息服務中應用個性化推送技術為讀者提供感興趣的個性化內容,大大提高
了用戶粘性和服務體驗。但是,隨著數字內容越來越多,基于這些技術推送給讀者的內容卻
越來越不準。主要原因是這些個性化技術都是基于對內容進行相似性聚類,或者將內容與用
戶的檢索詞匹配,相似的內容被直接推送給用戶,而不管是否適合用戶。在搜索引擎或電子
商務領域推送效果不錯,因為這些領域中網頁、商品及用戶之間都是同一層次的,但是在在
線教育或文獻檢索領域,集成出版的海量內容不是同一層次的,例如在文獻庫中,有些內容
是基礎研究,有些是對成果的新聞報導,同時讀者水平也是多層次的,有些是科研人員,有
些是學生或者記者,他們因水平和關注點不同,需要不同層次的內容,推送的內容也應該是
少量的、準確的。也就是說,在這些領域給讀者提供推送服務,不僅需要推送的內容主題相
似,還需要考慮讀者水平、內容層次在指定范圍內的匹配,才能給讀者提供基于興趣的、更
準確的內容推送服務。例如:向科研人員應該推送中、高級科研內容,他們對新聞報告或教
學類文獻沒有興趣。因此,這些常用的個性化推送技術在在線學習、文獻檢索領域使用效果
不好。

發明內容

針對上述問題,本發明提出一種基于讀者層次的內容推送方法。該方法分為兩個階段,
第一是讀者層次模型訓練階段,第二是內容推送階段。

在訓練階段,根據應用領域的實際情況,將讀者按水平或類型分層次,得到讀者層次向
量,讀者設計多少層次,由應用復雜性和資源加工復雜性決定;制訂讀者層次推送策略,既
根據什么原則向某層次讀者推送相關內容;建立讀者層次模型,對應每一層次讀者,涉及包
括:資源層次、資源類型、出版時間、語種、其他信息5類參數向量,這些向量維度上的值
都來自基于資源庫知識的訓練,用于描述該層次讀者在這些方面的特征;建設足夠數量的訓
練集,對讀者層次模型進行訓練,得到模型各維度參數向量的特征值。

在推送階段,實際使用時,記錄讀者一定時期的實際操作信息,主要是讀者使用過的資
源列表;根據讀者所使用資源的元數據信息,計算出該讀者的5類層次參數向量;基于讀者
的層次參數,通過讀者層次模型進行機器學習,得到預測的讀者層次;讀者后續使用時,基
于傳統的內容相似性比較以及讀者層次和推送策略,向讀者推送少量的精準內容;根據讀者
對推送內容的反映,不斷優化推送策略。

附圖說明

圖1是讀者層次模型訓練功能流程圖

圖2是讀者層次模型數據結構示意圖

圖3是基于讀者層次的內容推送功能流程圖

具體實施方式

下面結合附圖對本發明的實施方式進行詳細描述。

圖1是讀者層次模型訓練功能流程圖。如圖1所示,在訓練階段,根據應用領域的實際
情況,讀者層次分類11將讀者按水平或類型分層次,得到讀者層次向量<層次1;層次2...
層次n>,例如將讀者分為5個層次,得到層次向量<高級;中高級;中級;中低級;初級>。

建立讀者層次推送策略12,針對每層讀者,指定推送哪些主要內容,推送數量或比例,
這由具體應用領域和應用經驗確定。例如,在書法數字化學習領域,對于高級學習者,重點
推薦書法類期刊文獻、相關作品鑒賞、書法大賽信息;對于初級書法學習者,可以重點推薦
相關書法學習視頻、書法家介紹、書法故事,每項推送1-3條。

建立讀者層次模型15,如圖2所示。對應每一層次讀者,建立包括:資源層次21、資源
類型22、出版時間23、語種24、其他信息25共5類層次參數向量,這些維度上的值都來自
基于資源庫知識的訓練結果。

建設足夠數量的訓練集14,對讀者層次模型進行訓練13,得到圖2所示5類層次參數向
量各維度的特征值。

圖3是基于讀者層次的內容推送功能流程圖。如圖3所示,實際使用時,記錄讀者一定
時期的實際操作信息31,主要是學習使用了哪些資源,形成資源列表;根據讀者所使用資源
的元數據信息,計算出該讀者的層次參數32,包括資源層次、資源類型、出版時間、語種、
其他信息5類參數,向量數據結構如圖2所示,每部分對應該讀者使用資源形成的權重向量,
權重進行歸一化處理。

基于讀者的層次參數,采用讀者層次模型進行機器學習33,得到預測的讀者層次,例如
為高級讀者。

在讀者繼續發出檢索請求或者閱讀某篇內容時,基于傳統的內容相似性比較,得到大量
符合內容相似性要求的候選推薦結果,結合讀者層次以及該層次的推送策略34,選擇同時符
合推送策略的、少量的精準內容35,推送給讀者,而不是完全按照內容相似性結果進行推送;
讀者對推送結果如果有興趣,會點擊使用,如果沒有興趣,會忽略,通過讀者對推送內容的
反映,定期優化推送策略36。

由于推送時充分考慮了讀者個人在學習體系中所處的層次和水平,以及基于全體同層次
學習者共同遵循的推送策略,向讀者推送的少量內容,準確性更高,讀者體驗更好。

本方法中機器學習33實現對讀者層次的預測,它是基于讀者層次模型的知識,采用多維
度向量內積,加權求和,取最大值對應的讀者層次作為預測的讀者層次,計算公式如下所示:

C = max i = 1 n Σ j = 1 5 k j · P j · C ij ]]>

其中:為當前讀者第j部分的層次參數向量,j從1到5代表共有5部分參數,包括
資源層次、資源類型、出版時間、語種、其他信息;

是指讀者層次模型中第i類讀者第j部分的參數向量,這些向量在訓練時確定;

kj是向量權重因子,

n為讀者層次數,C為n類讀者中層次向量權重最大類型對應的讀者層次號。

在上述內容中,所有向量都需要進行歸一化權重處理,確保進行基于相同度量上的向量
運算具有可比性。

雖然本發明所揭露的實施方式如上,但所述的內容只是為了便于理解本發明而采用的實
施方式,并非用以限定本發明。任何本發明所屬技術領域內的技術人員,在不脫離本發明所揭
露的精神和范圍的前提下,可以在實施的形式上及細節上作任何的修改與變化,但本發明的專
利保護范圍,仍須以所附的權利要求書所界定的范圍為準。

關 鍵 詞:
一種 基于 讀者 層次 內容 推送 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:一種基于讀者層次的內容推送方法.pdf
鏈接地址:http://www.wwszu.club/p-6401718.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大