需要金幣:![]() ![]() |
資料包括:完整論文 | ![]() |
![]() |
轉(zhuǎn)換比率:金額 X 10=金幣數(shù)量, 例100元=1000金幣 | 論文字?jǐn)?shù):20186 | ![]() | |
折扣與優(yōu)惠:團(tuán)購最低可5折優(yōu)惠 - 了解詳情 | 論文格式:Word格式(*.doc) | ![]() |
摘要:大數(shù)據(jù)時(shí)代使得數(shù)字圖像的數(shù)量和規(guī)模與日俱增,給圖像處理帶來挑戰(zhàn)。提高圖像識別的效率和速率,對圖像物體檢測與識別具有一定的現(xiàn)實(shí)意義。 深度學(xué)習(xí)DL(Deep Learning)是近幾年熱門的一種含有多層結(jié)構(gòu)的深度神經(jīng)網(wǎng)絡(luò)。通過學(xué)習(xí)一種深層非線性網(wǎng)絡(luò)結(jié)構(gòu),提高對復(fù)雜分類問題的泛化能力。 由此而言,在圖像檢測難度較大的情況下,為達(dá)到更高的處理效率和準(zhǔn)確率,運(yùn)用深度學(xué)習(xí)技術(shù)便順理成章。本選題將研究應(yīng)用機(jī)器學(xué)習(xí)方法的最新成果深度學(xué)習(xí)來實(shí)現(xiàn)目標(biāo)類別檢測。 本文的主要工作包括: (1)查閱近年來的深度學(xué)習(xí)及目標(biāo)檢測的相關(guān)文獻(xiàn)資料,了解深度學(xué)習(xí)和圖像檢測算法的國內(nèi)外研究現(xiàn)狀,概述深度學(xué)習(xí)的發(fā)展及其機(jī)理和訓(xùn)練方法,研究深度學(xué)習(xí)的Caffe框架及卷積神經(jīng)網(wǎng)絡(luò)、Fast R-CNN等機(jī)理; (2)在Linux系統(tǒng)下搭建Caffe學(xué)習(xí)框架,應(yīng)用CUDA并行架構(gòu),采用基于AlexNet網(wǎng)絡(luò)的圖像目標(biāo)檢測Fast R-CNN模型,通過交替無監(jiān)督和有監(jiān)督學(xué)習(xí)訓(xùn)練網(wǎng)絡(luò),最終實(shí)現(xiàn)對圖像目標(biāo)人、貓、車、沙發(fā)等二十個(gè)類別的檢測; (3)通過實(shí)驗(yàn)驗(yàn)證Fast R-CNN在數(shù)據(jù)集PASCAL VOC 2007的檢測效果較為理想,證實(shí)使用深度學(xué)習(xí)進(jìn)行圖像目標(biāo)檢測具有可行性和有效性。
關(guān)鍵詞 目標(biāo)類別檢測;深度學(xué)習(xí);卷積神經(jīng)網(wǎng)絡(luò);Fast R-CNN
目錄 摘要 Abstract 1 緒論-1 1.1 課題背景-1 1.2 研究目的及意義-2 1.3 國內(nèi)外研究現(xiàn)狀-2 1.3.1 國內(nèi)研究現(xiàn)狀-2 1.3.2 國外研究現(xiàn)狀-3 1.4 論文組織結(jié)構(gòu)-4 2 深度學(xué)習(xí)相關(guān)技術(shù)-5 2.1 深度學(xué)習(xí)概述-5 2.2 深度學(xué)習(xí)機(jī)理及訓(xùn)練方法-6 2.2.1 深度學(xué)習(xí)機(jī)理-6 2.2.2 深度學(xué)習(xí)訓(xùn)練方法-6 2.3 卷積神經(jīng)網(wǎng)絡(luò)CNN-7 2.3.1 卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)-7 2.3.2 卷積操作-8 2.3.3 子采樣(池化)操作-9 2.4 本章小結(jié)-10 3 深度學(xué)習(xí)框架Caffe-11 3.1 Caffe概述-11 3.2 Caffe層次結(jié)構(gòu)簡介-11 3.2.1 Blob數(shù)據(jù)-11 3.2.2 Layer的計(jì)算和連接-12 3.2.3 Net的定義和操作-12 3.2.4 Loss簡介-13 3.2.5 Methods-13 3.2.6 Solver簡介-13 3.3 Caffe中的機(jī)器學(xué)習(xí)相關(guān)內(nèi)容介紹-14 3.3.1 GDM梯度下降法-14 3.3.2 SGD隨機(jī)梯度下降法-14 3.3.3 設(shè)定學(xué)習(xí)率和動(dòng)量的經(jīng)驗(yàn)法則-15 3.4 本章小結(jié)-16 4 Fast R-CNN目標(biāo)類別檢測模型機(jī)理-17 4.1 系統(tǒng)基本框架AlexNet-17 4.2 R-CNN模型-18 4.3 SPP-Net模型-19 4.4 Fast R-CNN模型-19 4.5 本章小結(jié)-20 5 基于深度學(xué)習(xí)的圖像目標(biāo)識別與分類的實(shí)現(xiàn)-21 5.1 硬件及軟件環(huán)境介紹-21 5.2 基于深度學(xué)習(xí)的圖像目標(biāo)分類與檢測的具體實(shí)現(xiàn)-21 5.2.1 下載數(shù)據(jù)集-21 5.2.2 解壓生成VOCdevkit文件夾-21 5.2.3 建立鏈接-22 5.2.4 下載預(yù)計(jì)算的目標(biāo)建議-22 5.2.5 下載預(yù)訓(xùn)練的ImageNet模型-22 5.2.6 訓(xùn)練Fast R-CNN-22 5.3 系統(tǒng)實(shí)驗(yàn)測試與分析-23 5.3.1 數(shù)據(jù)集與評測指標(biāo)-24 5.3.2 算法及參數(shù)測試分析-24 5.4 本章小結(jié)-27 結(jié)論-28 致謝-29 參考文獻(xiàn)-30 |