鬼佬大哥大
  • / 14
  • 下載費用:30 金幣  

一種基于邊聚集系數的社會網絡群體劃分方法.pdf

摘要
申請專利號:

CN201410342707.0

申請日:

2014.07.15

公開號:

CN105279187A

公開日:

2016.01.27

當前法律狀態:

實審

有效性:

審中

法律詳情: 實質審查的生效IPC(主分類):G06F 17/30申請日:20140715|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 天津科技大學
發明人: 張賢坤; 田雪
地址: 300222天津市河西區大沽南路1038號
優先權:
專利代理機構: 代理人:
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201410342707.0

授權公告號:

|||

法律狀態公告日:

2016.02.24|||2016.01.27

法律狀態類型:

實質審查的生效|||公開

摘要

本發明涉及一種基于邊聚集系數的網絡群體劃分方法,該方法具體過程是:讀取社交網絡數據,構造以社交網絡用戶為節點,用戶關系為邊的社交網絡圖,為每一個用戶隨機賦予一個唯一的標簽值,采用基于邊聚集系數的標簽傳播算法來更新用戶節點的標簽,經過幾步的迭代更新后,緊密連接的節點將會擁有相同的特定標簽值。根據本發明實施例的社會網絡群體劃分方法,根據用戶關系圖邊聚集系數屬性,通過改進標簽傳播算法,對用戶群體進行劃分,劃分結果對網絡輿情監測、商業用戶挖掘等都具有較好的應用價值。

權利要求書

1.一種基于邊聚集系數的社會網絡群體劃分方法,其特征在于,所述方法包括以下步驟:步驟A:讀取社交網絡數據,構造以社交網絡用戶為節點,用戶關系為邊的社交網絡圖;步驟B:節點標記:為每一個用戶節點隨機分配一個唯一的標簽值,作為它所屬社區的標識;步驟C:初步社區劃分:對圖中的所有頂點的標簽進行迭代更新,每次迭代后,節點的標簽值更新為其鄰接節點的標簽中數量最多的標簽值;步驟D:社區劃分細化:如果有多個標簽值的數量同為最大值時,計算待更新節點與鄰接節點之間邊的邊聚集系數,邊聚集系數大的鄰居節點標簽優先被選擇進行傳播;經過若干次迭代后,每個用戶節點鄰居中的標簽變化趨于穩定;步驟E:將所有具有相同標簽的節點歸為一個社區。2.根據權利要求1所述的一種基于邊聚集系數的社會網絡群體劃分方法,其特征在于,在上述步驟B中,為每一個用戶節點隨機分配一個唯一的標簽值,即Cn=Ln,Cn表示節點n所屬社區,Ln表示節點n的標簽值。3.根據權利要求1所述的一種基于邊聚集系數的社會網絡群體劃分方法,其特征在于,在上述步驟C中,對節點的標簽值更新為其鄰接節點的標簽中數量最多的標簽值具體過程為:把社交網絡圖抽象成一個簡單的無向圖G(N,E),其中,N表示節點的集合,E表示邊的集合;Wnm表示連接n,m節點的邊的權重,n,m∈N,用Cn表示表示節點n所屬社區,Nl(n)表示節點n∈N的鄰居節點中標簽值為1的節點集合,公式如下:4.根據權利要求1所述的一種基于邊聚集系數的社會網絡群體劃分方法,其特征在于:在上述步驟D中,所謂邊聚集系數,表示連接邊的兩個節點的聚集程度,它的值越大,代表這條邊所連接的兩個節點的連接強度就越強,說明這兩個節點在同一個社區的可能性就越大,具體定義規則如下:假設有一條邊Eij,它的頂點為i和j,如果想知道網絡中是否存在以及有多少另外的節點k與i、j均相鄰,即存在另外兩條邊Ejk、Eik、Eij形成三角環(邊數為3的閉合路徑);若一個三角環包含一條連接不同社區的邊,則該三角環中的另兩條邊中的某一條仍然連接兩個社區的可能性將會很大;因此,一條邊的邊聚集系數定義為包含該邊的三角環所占比例:其中,ki、kj分別代表節點i和j的度,zij表示網絡中實際包含該邊的三角形的個數,公式中的分母表示包含該邊的最大可能的三角形個數。5.根據權利要求1所述的一種基于邊聚集系數的社會網絡群體劃分方法,其特征在于:所述步驟D中,迭代終止條件為社交網絡達到平衡,標簽數目不再發生變化即終止迭代。

關 鍵 詞:
一種 基于 聚集 系數 社會 網絡 群體 劃分 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:一種基于邊聚集系數的社會網絡群體劃分方法.pdf
鏈接地址:http://www.wwszu.club/p-6405418.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大