需要金幣:![]() ![]() |
資料包括:完整論文 | ![]() |
![]() |
轉(zhuǎn)換比率:金額 X 10=金幣數(shù)量, 例100元=1000金幣 | 論文字?jǐn)?shù):8390 | ![]() | |
折扣與優(yōu)惠:團購最低可5折優(yōu)惠 - 了解詳情 | 論文格式:Word格式(*.doc) | ![]() |
摘要:經(jīng)歷生物數(shù)據(jù)爆炸時期的我們,如何對這樣大量的信息進行研究學(xué)習(xí),是一個很大的難題,所以我們就應(yīng)該要去找出能解決這個問題的辦法。對于這樣復(fù)雜而且數(shù)量巨大的生物數(shù)據(jù),以前的傳統(tǒng)方法已經(jīng)不能夠滿足統(tǒng)計分析這些數(shù)據(jù)的需求了。生物信息學(xué)就產(chǎn)生在這樣的環(huán)境里了。 本文中,我們提出了k字間隔序列的概念來反映k字在DNA序列中的分布情況,并將k字間隔序列的Lempel-Ziv(LZ)復(fù)雜度作為k字特征,構(gòu)建了一個4k維的特征向量,通過歐式距離構(gòu)建距離矩陣,并通過鄰接法構(gòu)建了三組數(shù)據(jù)的進化樹。當(dāng)k的取值從2到7時,我們分別構(gòu)建了進化樹,通過比較發(fā)現(xiàn)k的值取7時,構(gòu)建的進化樹比較可靠。通過與經(jīng)典結(jié)果進行比較,說明了我們方法的有效性。
關(guān)鍵詞:k字;LZ復(fù)雜度;進化樹
目錄 摘要 Abstract 1.1 生物信息學(xué)產(chǎn)生的背景-3 1.1.2 生物信息學(xué)的定義-3 1.2 生物信息學(xué)的研究對象和發(fā)展-3 1.2.1 生物信息學(xué)的研究任務(wù)與發(fā)展前景-3 1.2.1 核酸-4 1.2.2 DNA-4 1.2.3 RNA-4 2 進化樹構(gòu)建方法-5 2.1比對方法-5 2.2非比對方法-6 2.2.1 圖形表示模型-6 2.2.2信息復(fù)雜度模型-8 2.3 進化樹構(gòu)建方法-9 2.3.1 基于距離構(gòu)建法-10 3 基于LZ復(fù)雜度的進化樹構(gòu)建-11 3.1 數(shù)據(jù)集介紹-11 3.1.1 30種哺乳動物線粒體基因-11 3.1.2 24種脊椎動物的轉(zhuǎn)鐵蛋白-14 3.1.3 48種戊型肝炎病毒-16 3.2 信息提取方法介紹-19 3.3 構(gòu)建的進化樹-19 結(jié) 論-23 參 考 文 獻-23 致 謝-24 |