需要金幣:![]() ![]() |
資料包括:完整論文 | ![]() |
![]() |
轉(zhuǎn)換比率:金額 X 10=金幣數(shù)量, 例100元=1000金幣 | 論文字數(shù):8824 | ![]() | |
折扣與優(yōu)惠:團購最低可5折優(yōu)惠 - 了解詳情 | 論文格式:Word格式(*.doc) | ![]() |
摘要:視頻點播系統(tǒng)的實現(xiàn)與管理、主要使用python爬蟲技術(shù)、為什么我會選擇爬蟲技術(shù)呢?因為爬蟲技術(shù)可以很大程度上提高管理人員的效率,并且,在數(shù)據(jù)更新如此之快的今天用了爬蟲技術(shù)不用再擔(dān)心本網(wǎng)站電影更新速度不及時的這個問題了,下面我來講解一下網(wǎng)站具體實現(xiàn)的操作[1]。從豆瓣網(wǎng)上把電影爬取出來,將爬出來的數(shù)據(jù)放在elasticsearch引擎和數(shù)據(jù)庫里面,然后用視頻點播網(wǎng)站通過elasticsearch去查詢數(shù)據(jù)自身輿情和推送功能。系統(tǒng)在研發(fā)過程是使用的是SpringBoot框架進行項目構(gòu)建,我使用了Spring+SpringMVC+Hibernate進行架構(gòu)設(shè)計,后臺的數(shù)據(jù)庫我使用的是MySQL5,應(yīng)用ElasticSearch技術(shù)對全文進行檢索,增大了數(shù)據(jù)檢索及系統(tǒng)的加載速度。該系統(tǒng)主要是通過互聯(lián)網(wǎng)時刻監(jiān)控到周邊樓盤的政策和輿情,使相關(guān)人員能夠根據(jù)輿情的數(shù)據(jù)做出輿情的處理,可以使我自己的網(wǎng)站能夠?qū)崟r擁有豆瓣網(wǎng)站的數(shù)據(jù),節(jié)省了工作人員的大量時間。
關(guān)鍵詞:爬蟲技術(shù);ElasticSearch全文檢索;elasticsearch
目 錄 摘 要 Abstract 1 緒論-1 1.1 課題研究的背景與目的-1 1.2 國內(nèi)外研究現(xiàn)狀-1 1.3 視頻點播系統(tǒng)系統(tǒng)的概述-2 2 需求分析及可行性分析-3 2.1 需求分析-3 2.2 可行性分析-3 2.2.1數(shù)據(jù)來源可行性分析-4 2.2.2開發(fā)成本可行性分析-4 2.2.3技術(shù)可行性分析-4 3 系統(tǒng)設(shè)計-5 3.1 系統(tǒng)總功能描述-5 3.1.1數(shù)據(jù)來源模塊-5 3.1.2搜索引擎模塊-6 3.1.3數(shù)據(jù)的展示模塊-6 3.2 系統(tǒng)結(jié)構(gòu)設(shè)計-7 3.3 數(shù)據(jù)庫結(jié)構(gòu)設(shè)計-8 4 系統(tǒng)實現(xiàn)-9 4.1首頁展示-9 4.2 數(shù)據(jù)同步至elasticseaech-9 4.3 通過web展示數(shù)據(jù)-10 4.4 系統(tǒng)設(shè)計中的困難點-10 4.4.1使用elasticsearch遇到的問題-10 4.4.2使用爬蟲技術(shù)遇到的問題-11 4.4.3插入數(shù)據(jù)時的問題-11 5 系統(tǒng)測試-12 5.1 測試概要-12 5.2 軟件測試-12 5.2.1爬蟲技術(shù)的測試-12 5.2.2數(shù)據(jù)的同步-12 5.2.3數(shù)據(jù)庫中是否成功插入數(shù)據(jù)-13 5.2.4電影主頁分類測試-13 結(jié) 論-15 謝 辭-16 參考文獻-17 |