需要金幣:![]() ![]() |
資料包括:完整論文 | ![]() |
![]() |
轉(zhuǎn)換比率:金額 X 10=金幣數(shù)量, 例100元=1000金幣 | 論文字?jǐn)?shù):14130 | ![]() | |
折扣與優(yōu)惠:團購最低可5折優(yōu)惠 - 了解詳情 | 論文格式:Word格式(*.doc) | ![]() |
摘要:近年來,隨著寬帶網(wǎng)絡(luò)技術(shù)、新型多媒體技術(shù)和信息通信技術(shù)的飛快發(fā)展,我們步入了一個嶄新的互聯(lián)網(wǎng)時代。我們知道,視頻資源中包含豐富的語義信息和視頻關(guān)鍵內(nèi)容,為此,對圖像和視頻中文本檢測和提取成為本文研究主題。 本文在現(xiàn)有研究的基礎(chǔ)上主要對視頻幀圖像中文字的檢測、定位、識別方法和實現(xiàn)手段展開研究。課題研究的重點主要為視頻幀的截取、圖像預(yù)處理、圖像文本定位、圖像字符分割、字符模板庫的創(chuàng)建和字符匹配及識別六個方面。在視頻幀的提取上,采用MATLAB中相關(guān)函數(shù)對視頻文件進(jìn)行分幀處理,獲得視頻相應(yīng)的幀圖像序列。在圖像預(yù)處理方面,一是對彩色圖像進(jìn)行灰度化處理和二值化處理。二是對圖像進(jìn)行形態(tài)學(xué)運算,包括膨脹和腐蝕。在文本定位方法的選取上,本文采用了掃描法;圖像字符分割采用閾值分割算法。字符模板庫的創(chuàng)建和字符匹配運用的是模板匹配法,該方法是圖像處理中最為常用的一種。最后,本文分析了當(dāng)前視頻圖像中字符切割算法的缺點和所存在的問題以及應(yīng)用領(lǐng)域。
關(guān)鍵詞:數(shù)學(xué)形態(tài)學(xué);文本定位;自適應(yīng)閾值分割;字符識別;模板匹配
目錄 摘要 Abstract 1 緒論-1 1.1 研究背景及意義-1 1.2 發(fā)展歷史-2 1.2.1前言-2 1.2.2發(fā)展歷史-2 1.3 國內(nèi)外研究現(xiàn)狀-3 1.4 論文的主要內(nèi)容-4 2 視頻和圖像處理-5 2.1 視頻圖像中文本分類和特點-5 2.1.1 視頻圖像中文本分類-5 2.1.2 視頻圖像中文本特點-6 2.2 視頻載入-8 2.3 視頻幀提取-9 2.4 視頻圖像預(yù)處理-9 2.4.1圖像灰度化-9 2.4.2圖像二值化-10 2.5 圖像數(shù)學(xué)形態(tài)學(xué)-11 2.5.1腐蝕操作-12 2.5.2膨脹操作-12 2.5.3開運算-13 2.5.4閉運算-13 2.6 本章小結(jié)-13 3 視頻圖像文本定位和識別-14 3.1文本定位的基本方法-14 3.1.1 基于區(qū)域的文本定位-14 3.1.2 基于邊緣的文本定位-14 3.1.3 基于紋理的文本定位-15 3.1.4 基于學(xué)習(xí)的文本定位-15 3.2 文本識別-16 3.2.1 字符切分-16 3.2.2 字符歸一化-16 3.2.3 文本識別-17 3.3 本章小結(jié)-17 4 系統(tǒng)設(shè)計及實現(xiàn)-18 4.1 視頻載入-18 4.1.1視頻文件讀取-18 4.1.2視頻信息獲取-19 4.1.3獲取視頻圖像序列-20 4.2 視頻幀獲取-21 4.3 圖像預(yù)處理-22 4.3.1圖像灰度化-22 4.3.2圖像二值化-22 4.3.3腐蝕運算-23 4.3.4膨脹運算-23 4.4 文本定位-24 4.4.1文本邊緣區(qū)域選定-24 4.4.2字符分割-25 4.5 文本識別-26 4.6 本章小結(jié)-27 結(jié) 論-28 參 考 文 獻(xiàn)-29 致 謝-30 |