社交網(wǎng)絡(luò)中信息、病毒、行為等傳播過(guò)程在不同程度上依賴于網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。Johan Ugander等人提出了在社交網(wǎng)絡(luò)結(jié)構(gòu)對(duì)用戶行為影響方面的研究成果1。這里考慮用戶在Facebook上的兩種行為:注冊(cè)過(guò)程(recruitment)和參與過(guò)程(engagement)。注冊(cè)過(guò)程是指用戶收到某個(gè)Facebook用戶的邀請(qǐng)郵件從而注冊(cè)Facebook的過(guò)程。參與過(guò)程是指用戶注冊(cè)Facebook之后參與具體的活動(dòng)的過(guò)程。雖然這兩個(gè)過(guò)程都在Facebook上進(jìn)行,但是他們的具體過(guò)程存在很大差異,Johan Ugander等人主要考慮用戶節(jié)點(diǎn)的結(jié)構(gòu)多樣性對(duì)用戶產(chǎn)生這兩種行為的影響。所謂用戶節(jié)點(diǎn)的結(jié)構(gòu)多樣性,是指用戶節(jié)點(diǎn)在社交網(wǎng)絡(luò)中的鄰居節(jié)點(diǎn)所屬的連通分量的個(gè)數(shù)。
假設(shè)一個(gè)用戶A不是Facebook的用戶,那么把A的電子郵件地址輸入Facebook的用戶就是A可能認(rèn)識(shí)的所有Facebook用戶。這里定義擁有A的電子郵件地址的Facebook用戶為A在Facebook的接觸鄰居用戶。這些接觸鄰居用戶是A未來(lái)潛在朋友的子集。事實(shí)上A可能認(rèn)識(shí)更多的人,但是由于其中一部分用戶沒(méi)有注冊(cè),我們無(wú)法用他們作為樣本來(lái)預(yù)測(cè)一個(gè)用戶是否注冊(cè)Facebook(即注冊(cè)過(guò)程)。Johan Ugander等人通過(guò)分析了包含五千四百萬(wàn)封邀請(qǐng)郵件的數(shù)據(jù)來(lái)研究一個(gè)基本問(wèn)題:用戶注冊(cè)Facebook的概率和他的接觸鄰居結(jié)構(gòu)之間的關(guān)系是什么?傳統(tǒng)的假設(shè)是這個(gè)概率隨著接觸鄰居的個(gè)數(shù)單調(diào)遞增。而Johan Ugander等人給出的結(jié)果是用戶注冊(cè)Facebook的概率只和接觸鄰居組成的連通分量的個(gè)數(shù)有關(guān);只有一個(gè)接觸鄰居時(shí),F(xiàn)acebook用戶轉(zhuǎn)化率和接觸鄰居之間的連接邊密度之間的關(guān)系,結(jié)果顯示兩者之間無(wú)明顯關(guān)系;接觸鄰居組成的連通分量個(gè)數(shù)固定時(shí),接觸鄰居的個(gè)數(shù)越多意味著Facebook用戶轉(zhuǎn)化率越低。
考慮結(jié)構(gòu)多樣性對(duì)Facebook用戶登錄頻率的影響。具體地說(shuō),就是考慮2010年注冊(cè)Facebook的用戶在注冊(cè)后一個(gè)星期時(shí)的結(jié)構(gòu)多樣性能否預(yù)測(cè)注冊(cè)三個(gè)月后這些用戶是否頻繁登陸Facebook。用戶頻繁登陸的標(biāo)準(zhǔn)是每周至少6天登陸Facebook。Facebook用戶的朋友規(guī)模要比電子郵件規(guī)模大很多,2010年注冊(cè)的用戶數(shù)量大約一千萬(wàn),一周后他們的朋友數(shù)目從10到50不等,并且由于用戶的朋友組成的連通分量中有很大比例是單個(gè)用戶(節(jié)點(diǎn)),因此用戶的朋友組成的連通分量的個(gè)數(shù)并不能準(zhǔn)確反映社會(huì)環(huán)境多樣性。為了更準(zhǔn)確的反映社會(huì)環(huán)境的多樣性,給出了三類誘導(dǎo)連通分量個(gè)數(shù)。第一類誘導(dǎo)連通分量個(gè)數(shù)是節(jié)點(diǎn)數(shù)量為k的連通分量個(gè)數(shù)。第二類誘導(dǎo)連通分量個(gè)數(shù)是鄰居節(jié)點(diǎn)的k-core結(jié)構(gòu)的連通分量個(gè)數(shù)。第三類誘導(dǎo)連通分量個(gè)數(shù)是鄰居節(jié)點(diǎn)的k-brace結(jié)構(gòu)的連通分量個(gè)數(shù)。其中一條邊的嵌入度定義為邊的兩個(gè)節(jié)點(diǎn)的共同鄰居節(jié)點(diǎn)數(shù)目,一幅圖的k-brace結(jié)構(gòu)定義為重復(fù)刪除嵌入度小于k的邊和孤立節(jié)點(diǎn)所剩余的子圖。當(dāng)用戶在注冊(cè)一周時(shí)的以上三類誘導(dǎo)連通分量個(gè)數(shù)越多,3個(gè)月后用戶登錄頻率越高,因此誘導(dǎo)連通分量個(gè)數(shù)能很好地反映用戶所在的社會(huì)環(huán)境的多樣性并能有效地預(yù)測(cè)用戶登錄頻率。當(dāng)用戶登錄頻率隨連邊密度增加先增大后減小,即在(0,1)區(qū)間內(nèi)存在一個(gè)峰值。存在峰值的一種可能解釋是如果鄰居節(jié)點(diǎn)連邊密度太小意味著缺少社會(huì)環(huán)境,而連邊密度太高意味著社會(huì)環(huán)境缺少多樣性。