需要金幣:![]() ![]() |
資料包括:完整論文 | ![]() |
![]() |
轉(zhuǎn)換比率:金額 X 10=金幣數(shù)量, 例100元=1000金幣 | 論文字?jǐn)?shù):9716 | ![]() | |
折扣與優(yōu)惠:團(tuán)購(gòu)最低可5折優(yōu)惠 - 了解詳情 | 論文格式:Word格式(*.doc) | ![]() |
摘要:從2012年開(kāi)始,Web2.0的發(fā)展更是突飛猛進(jìn),中國(guó)網(wǎng)民的參與度和活躍性呈現(xiàn)爆炸式增長(zhǎng),這一情況的出現(xiàn),與一種新媒體形態(tài)的誕生不無(wú)關(guān)系—微博。新浪微博平臺(tái)提供一些數(shù)據(jù)接口(API)供研究人員獲取研究數(shù)據(jù),API使數(shù)據(jù)的獲取不再難,但是API對(duì)用戶權(quán)限和獲取頻率做出了一些限制,這也使研究者對(duì)微博內(nèi)容的搜索難度大大增加。對(duì)此,本文提供了一種基于Java語(yǔ)言的新浪微博網(wǎng)絡(luò)爬蟲(chóng),方便新浪微博數(shù)據(jù)獲取。 基于Java爬蟲(chóng)的新浪微博數(shù)據(jù)分析系統(tǒng),采用Java語(yǔ)言編寫(xiě)爬蟲(chóng),在Windows8系統(tǒng)環(huán)境下以IntelliJ-IDEA為開(kāi)發(fā)工具,采用現(xiàn)在流行的Springboot全新框架去簡(jiǎn)化應(yīng)用的初始搭建和開(kāi)發(fā)過(guò)程,程序通過(guò)爬蟲(chóng)模擬登陸網(wǎng)頁(yè)版新浪微博獲取相關(guān)數(shù)據(jù),通過(guò)定時(shí)任務(wù)解決單IP爬取數(shù)據(jù)限制,并將爬取的數(shù)據(jù)保存在本地Mysql數(shù)據(jù)庫(kù)中。本文以山東魯能足球隊(duì)新浪微博為研究對(duì)象,爬取隊(duì)員微博數(shù)據(jù),并進(jìn)行進(jìn)一步分析,最終結(jié)果采用Html與Echarts結(jié)合的網(wǎng)頁(yè)呈現(xiàn)數(shù)據(jù)結(jié)果。 經(jīng)過(guò)測(cè)試,本系統(tǒng)可以有效爬取新浪微博數(shù)據(jù),并將數(shù)據(jù)存入本地?cái)?shù)據(jù)庫(kù)Mysql。與以往以Python爬蟲(chóng)不同,本系統(tǒng)采用Java爬蟲(chóng),通過(guò)定時(shí)任務(wù)解決單IP爬取數(shù)據(jù)限制,使研究者可以更方便、更高效的利用新浪微博官方API。本系統(tǒng)也通過(guò)魯能足球隊(duì)球員的新浪微博數(shù)據(jù)進(jìn)行了更深的分析,分析出球員的粉絲是否存在網(wǎng)絡(luò)水軍的現(xiàn)象以及球員粉絲還關(guān)注其他那些熱點(diǎn)博客。 關(guān)鍵詞:Java爬蟲(chóng),Mysql5.7,Springboot,Echarts
目錄 摘要 ABSTRACT 第1章 前言- 1 - 1.1研究背景- 1 - 1.2國(guó)內(nèi)外研究現(xiàn)狀- 1 - 1.3研究目的和意義- 1 - 1.3.1研究目的- 1 - 1.3.2研究意義- 2 - 1.4全文組織結(jié)構(gòu)- 2 - 第2章 基于Java爬蟲(chóng)新浪微博數(shù)據(jù)分析系統(tǒng)數(shù)據(jù)獲取與存儲(chǔ)- 3 - 2.1Java爬蟲(chóng)的設(shè)計(jì)- 3 - 2.2數(shù)據(jù)的獲取- 4 - 2.1.1微博內(nèi)容獲取- 4 - 2.1.2用戶關(guān)系獲取- 6 - 2.3數(shù)據(jù)庫(kù)的設(shè)計(jì)- 6 - 第3章 新浪微博數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)- 8 - 3.1新浪微博數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)- 8 - 3.1.1爬取數(shù)據(jù)的分析- 8 - 3.1.2數(shù)據(jù)分析結(jié)果的呈現(xiàn)- 8 - 3.1.3魯能足球隊(duì)實(shí)例分析方法以及結(jié)果- 9 - 第4章 系統(tǒng)實(shí)現(xiàn)- 13 - 4.1主要界面設(shè)計(jì)- 13 - 第5章 基于Java爬蟲(chóng)的微博數(shù)據(jù)分析系統(tǒng)測(cè)試- 16 - 5.1數(shù)據(jù)接口的穩(wěn)定測(cè)試- 16 - 5.2總體功能測(cè)試- 19 - 第6章 總結(jié)與展望- 24 - 6.1總結(jié)- 24 - 6.2 展望- 24 - 附 錄- 25 - 參 考 文 獻(xiàn)- 27 - 致 謝- 28 - |