需要金幣:![]() ![]() |
資料包括:完整論文 | ![]() |
![]() |
轉(zhuǎn)換比率:金額 X 10=金幣數(shù)量, 例100元=1000金幣 | 論文字?jǐn)?shù):21867 | ![]() | |
折扣與優(yōu)惠:團(tuán)購(gòu)最低可5折優(yōu)惠 - 了解詳情 | 論文格式:Word格式(*.doc) | ![]() |
摘要:互聯(lián)網(wǎng)自1969年誕生,一直遠(yuǎn)超人們的預(yù)期快速發(fā)展。微信公眾平臺(tái)從2012年作為一個(gè)新興的媒體平臺(tái),呈現(xiàn)出垂直、分層開發(fā)、專業(yè)經(jīng)營(yíng)趨勢(shì)。本文對(duì)微信公眾號(hào)行業(yè)分布趨勢(shì)進(jìn)行分析。 首先,對(duì)其數(shù)據(jù)進(jìn)行抓取,設(shè)計(jì)了網(wǎng)絡(luò)爬蟲程序,在爬取的程序中利用Scrapy框架,在數(shù)據(jù)抓取的過程中用到遞歸算法,并設(shè)計(jì)程序?qū)⒆ト〉降奈⑿殴娞?hào)的名稱、微信號(hào)、類別、省份、成立時(shí)間、介紹等信息存儲(chǔ)于數(shù)據(jù)庫(kù)中。然后使用數(shù)據(jù)可視化工具Tableau反映出微信公眾號(hào)行業(yè)分布,從多個(gè)角度不同行業(yè)進(jìn)行分析。 經(jīng)分析,從整個(gè)行業(yè)的角度來(lái)講,娛樂類的微信公眾號(hào)數(shù)量最多,其次是教育類的。這幾類中娛樂行業(yè)的開通率最高達(dá)83.55%,微信公眾號(hào)的發(fā)文次數(shù)也在提高約14.2%;從發(fā)文時(shí)間的角度來(lái)講,一天中的早晚高峰特別是16:00-19:00,這期間是微信公眾號(hào)發(fā)文高峰時(shí)間,也是閱讀高峰;從城市分布角度來(lái)說(shuō),在發(fā)達(dá)的城市,尤其是廣東和北京微信公眾號(hào)分布較多,當(dāng)然其他的城市也在不斷的發(fā)展中??偟恼f(shuō)來(lái),根據(jù)2016年第三四季度的預(yù)測(cè),2017年的微信公眾號(hào)市場(chǎng)還會(huì)保持快速發(fā)展。
關(guān)鍵詞 網(wǎng)絡(luò)爬蟲;微信公眾號(hào);Scrapy框架;數(shù)據(jù)可視化
目錄 摘要 Abstract 1 緒論-1 1.1 研究背景及意義-1 1.2 國(guó)內(nèi)外研究現(xiàn)狀-2 2 基本理論-4 2.1 網(wǎng)絡(luò)爬蟲概述-4 2.1.1 網(wǎng)絡(luò)爬蟲的概念-4 2.1.2 網(wǎng)絡(luò)爬蟲的原理-4 2.1.3 網(wǎng)絡(luò)爬蟲抓取策略-5 2.2 Scrapy框架-6 2.2.1 Scrapy組成-6 2.2.2 Scrapy框架的分布式策略-8 2.3 數(shù)據(jù)可視化工具的基本理論-10 2.3.1 數(shù)據(jù)可視化工具Tableau的基本功能-10 2.3.2 可視化工具Tableau的主要特性-10 3 網(wǎng)絡(luò)爬蟲程序設(shè)計(jì)-12 3.1 網(wǎng)絡(luò)爬蟲爬取入口-12 3.2 網(wǎng)絡(luò)爬蟲程序設(shè)計(jì)-12 3.2.1 數(shù)據(jù)抓取-13 3.2.2 數(shù)據(jù)存儲(chǔ)-16 3.2.3 數(shù)據(jù)獲取-18 4 行業(yè)分布趨勢(shì)分析-20 4.1 數(shù)據(jù)預(yù)處理-20 4.2 微信公眾號(hào)行業(yè)分布分析-22 4.2.1 公眾號(hào)發(fā)文量分析-22 4.2.2 公眾號(hào)發(fā)文時(shí)間分析-23 4.2.3 地區(qū)分布趨勢(shì)分析-25 4.3 微信公眾號(hào)行業(yè)分布預(yù)測(cè)-27 4.3.1 游戲行業(yè)分布預(yù)測(cè)-28 4.3.2 汽車行業(yè)分布預(yù)測(cè)-28 4.3.3 行業(yè)趨勢(shì)預(yù)測(cè)-29 結(jié)論-34 致謝-35 參考文獻(xiàn)-36 附錄-37 |