需要金幣:![]() ![]() |
資料包括:完整論文 | ![]() |
![]() |
轉(zhuǎn)換比率:金額 X 10=金幣數(shù)量, 例100元=1000金幣 | 論文字?jǐn)?shù):17404 | ![]() | |
折扣與優(yōu)惠:團(tuán)購最低可5折優(yōu)惠 - 了解詳情 | 論文格式:Word格式(*.doc) | ![]() |
摘要:中文分詞,就是由自動(dòng)為詞加入分隔符或打上標(biāo)記,將一段中文文本中的詞根據(jù)其具體的含義分隔開,實(shí)現(xiàn)正確或合理的斷句,準(zhǔn)確地表達(dá)意思。我們可以用自身現(xiàn)有的語言知識來分辨中文文本中的詞與單字,而借助計(jì)算機(jī)實(shí)現(xiàn)蘊(yùn)含人類理解的過程進(jìn)行分詞的技術(shù),就是中文分詞技術(shù)。 本文對現(xiàn)存的主流分詞方法進(jìn)行了分析和比較,對前人的成果和經(jīng)驗(yàn)進(jìn)行了研究和改進(jìn),設(shè)計(jì)實(shí)現(xiàn)了一個(gè)基于詞典和統(tǒng)計(jì)方法的在線中文分詞系統(tǒng)。本文系統(tǒng)使用了基于二種主流分詞方法的經(jīng)典算法,雙向最大匹配法和結(jié)合Viterbi算法的HMM統(tǒng)計(jì)方法。這兩種方法能夠較好地改善中文語言識別一直難以應(yīng)對處理的兩大問題:歧義識別和未登錄詞。本系統(tǒng)為用戶提供了一個(gè)中文分詞的在線平臺,有文本分詞,導(dǎo)入待分詞文件,導(dǎo)出結(jié)果等功能可供使用,并能夠由用戶根據(jù)文本內(nèi)容可能會出現(xiàn)的歧義和新詞問題,選擇不同的功能進(jìn)行劃分。本系統(tǒng)在切詞準(zhǔn)確度和速度上的表現(xiàn)較為良好,基本完成了中文分詞的工作,提供了較好的用戶體驗(yàn)。 本文系統(tǒng)的創(chuàng)新點(diǎn)在于,將python語言作為開發(fā)語言,并選擇了較為熱門的web框架django作為開發(fā)在線系統(tǒng)的框架, 實(shí)現(xiàn)了一個(gè)在線中文分詞系統(tǒng)。 該論文有圖15幅,表2個(gè),參考文獻(xiàn)26篇。
關(guān)鍵詞:中文分詞 雙向匹配 HMM Django Python
目錄 摘要 Abstract 1 緒論-1 1.1研究背景及意義1 1.2中文分詞的現(xiàn)狀1 1.3開發(fā)工具介紹-3 1.4 課題任務(wù)及論文結(jié)構(gòu)-9 1.5本章小結(jié)-9 2 中文分詞簡介-10 2.1中文分詞問題描述10 2.2中文分詞難點(diǎn)分析10 2.3主要的分詞算法-11 2.4本章小結(jié)16 3 需求分析-17 3.1系統(tǒng)功能需求分析17 3.2性能需求18 3.3可行性分析18 3.4本章小結(jié)19 4 系統(tǒng)總體設(shè)計(jì)-20 4.1系統(tǒng)的結(jié)構(gòu)劃分-20 4.2本章小結(jié)22 5 中文分詞系統(tǒng)實(shí)現(xiàn)-23 5.1系統(tǒng)設(shè)計(jì)與原則-23 5.2 Django的配置-23 5.3分詞功能模塊24 5.4用戶功能模塊25 5.5本章小節(jié)28 6 測試-29 6.1測試環(huán)境和測試方案-29 6.2系統(tǒng)評價(jià)標(biāo)準(zhǔn)29 6.3 實(shí)驗(yàn)結(jié)果與結(jié)論31 6.4本章小結(jié)31 7 用戶使用說明-33 7.1輸入待分詞文本-32 7.2功能選擇32 7.3 導(dǎo)入待分詞文件和導(dǎo)出結(jié)果-34 7.4本章小結(jié)34 8 總結(jié)與展望35 8.1總結(jié)35 8.2展望35 畢業(yè)設(shè)計(jì)體會36 參考文獻(xiàn)37 致謝38 |