需要金幣:![]() ![]() |
資料包括:完整論文 | ![]() |
![]() |
轉換比率:金額 X 10=金幣數(shù)量, 例100元=1000金幣 | 論文字數(shù):13322 | ![]() | |
折扣與優(yōu)惠:團購最低可5折優(yōu)惠 - 了解詳情 | 論文格式:Word格式(*.doc) | ![]() |
摘要:在數(shù)據(jù)量不斷增加,特別是非結構化數(shù)據(jù)日益增加的今天,大數(shù)據(jù)應用受到更加廣泛的關注。許多公司和組織積累了大量數(shù)據(jù),同時不斷產(chǎn)生新的數(shù)據(jù),這些數(shù)據(jù)的量級達到了PB、EB甚至ZB級別,超出了常規(guī)傳統(tǒng)數(shù)據(jù)庫的數(shù)據(jù)處理能力范圍,因而不得不尋找新的方式存儲、處理它們。分布式數(shù)據(jù)庫系統(tǒng)的海量數(shù)據(jù)存儲、處理能力正是大數(shù)據(jù)應用所需要的,所以對分布式數(shù)據(jù)庫在大數(shù)據(jù)中的應用有其研究必要性。 本文首先分析了大數(shù)據(jù)時代的來臨及其對現(xiàn)有的索引和數(shù)據(jù)庫技術的影響,并介紹了這一時代索引與數(shù)據(jù)庫的創(chuàng)新與發(fā)展。然后通過基于Hadoop分布式文件系統(tǒng)的HBase與傳統(tǒng)關系型數(shù)據(jù)庫的對比了解分布式數(shù)據(jù)庫系統(tǒng)在大數(shù)據(jù)應用方面的優(yōu)勢在于:數(shù)據(jù)存儲量大、擴展容易、容錯性強。最后通過搭建得到廣泛部署應用的Hadoop與HBase數(shù)據(jù)庫驗證HBase的主要特點:存儲量大、面向列、稀疏、自動分區(qū)、數(shù)據(jù)類型單一。
關鍵詞:Hadoop;大數(shù)據(jù);HBase;分布式數(shù)據(jù)庫
目錄 摘要 Abstract 1 緒論-1 1.1 研究背景與意義-1 1.2 國內(nèi)外現(xiàn)狀-1 1.3 大數(shù)據(jù)時代-1 1.3.1 大數(shù)據(jù)時代的到來-1 1.3.2 大數(shù)據(jù)時代到來的原因-1 2 大數(shù)據(jù)時代的數(shù)據(jù)庫分析-3 2.1 大數(shù)據(jù)特性-3 2.2 大數(shù)據(jù)時代的影響與發(fā)展-3 2.2.1 大數(shù)據(jù)時代對索引與數(shù)據(jù)庫的影響-3 2.2.2 大數(shù)據(jù)時代索引與數(shù)據(jù)庫的創(chuàng)新與發(fā)展-4 2.3 HBase數(shù)據(jù)庫介紹-5 2.3.1 HBase的特點-6 2.3.2 HBase與傳統(tǒng)數(shù)據(jù)庫的區(qū)別-6 2.3.3 HBase的高并發(fā)和實時處理數(shù)據(jù)-8 3 案例需求分析-10 3.1 采用Hadoop集群優(yōu)劣-10 3.2 Hadoop生態(tài)系統(tǒng)-11 3.3 Hadoop在互聯(lián)網(wǎng)的應用-12 4 Hadoop單一部署-14 4.1 Hadoop集群部署拓撲圖-14 4.2 安裝操作系統(tǒng)Centos-15 4.3 Hadoop 安裝與配置-21 5 HBase安裝與配置-25 6 HBase的優(yōu)化-31 致謝-33 參考文獻-34 |