需要金幣:![]() ![]() |
資料包括:完整論文 | ![]() |
![]() |
轉(zhuǎn)換比率:金額 X 10=金幣數(shù)量, 例100元=1000金幣 | 論文字?jǐn)?shù):8088 | ![]() | |
折扣與優(yōu)惠:團(tuán)購最低可5折優(yōu)惠 - 了解詳情 | 論文格式:Word格式(*.doc) | ![]() |
摘要:日益更新的社交工具衍生出了信息量巨大的社交網(wǎng)絡(luò),這其中含有大量的無用信息,使得獲取、存儲(chǔ)和處理十分不便,因此對(duì)原始網(wǎng)絡(luò)進(jìn)行抽樣具有重要意義。 本文使用了以下幾種抽樣算法來對(duì)某一社交網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行抽樣,包括隨機(jī)抽樣、廣度優(yōu)先搜索抽樣、滾雪球抽樣、森林火災(zāi)抽樣和隨機(jī)行走抽樣。然后通過計(jì)算和比較統(tǒng)計(jì)量再對(duì)這些抽樣策略的優(yōu)劣進(jìn)行評(píng)價(jià)。統(tǒng)計(jì)量過多的選取會(huì)影響評(píng)價(jià)的效率,因此本文以度分布,平均聚類系數(shù)和匹配系數(shù)作為評(píng)價(jià)指標(biāo)。 在統(tǒng)計(jì)量的計(jì)算過程中,本文在每種抽樣策略下取每種抽樣長(zhǎng)度的10次抽樣平均值進(jìn)行比較。最終得到,當(dāng)抽樣長(zhǎng)度較小時(shí),隨機(jī)行走抽樣效果較好,當(dāng)抽樣長(zhǎng)度較大時(shí),滾雪球抽樣的效果較好。
關(guān)鍵詞:隨機(jī)抽樣;滾雪球抽樣;森林火災(zāi)抽樣;度分布
目錄 摘要 Abstract 1緒論-1 1.1研究的背景-1 1.2國內(nèi)外研究現(xiàn)狀-1 1.3研究?jī)?nèi)容-2 2工作原理-3 2.1流程圖-3 2.2各抽樣算法工作原理-4 2.2.1 隨機(jī)抽樣-4 2.2.2 廣度優(yōu)先搜索抽樣-5 2.2.3 滾雪球抽樣-6 2.2.4 森林火災(zāi)抽樣-7 2.2.5 隨機(jī)行走抽樣-7 3 研究結(jié)果-8 3.1 軟件介紹-8 3.1.1 Python簡(jiǎn)介-8 3.1.2 networkx和Matplotlib簡(jiǎn)介-8 3.2 程序編寫-9 3.3 計(jì)算統(tǒng)計(jì)量-9 3.4 結(jié)果分析-12 總 結(jié)-15 參考文獻(xiàn)-16 附錄A 實(shí)現(xiàn)代碼-17 致 謝-24 |