需要金幣:![]() ![]() |
資料包括:完整論文 | ![]() |
![]() |
轉(zhuǎn)換比率:金額 X 10=金幣數(shù)量, 例100元=1000金幣 | 論文字?jǐn)?shù):15985 | ![]() | |
折扣與優(yōu)惠:團(tuán)購最低可5折優(yōu)惠 - 了解詳情 | 論文格式:Word格式(*.doc) | ![]() |
摘要:毋庸置疑大數(shù)據(jù)時(shí)代已經(jīng)來臨,而大數(shù)據(jù)本身并非是人們所想象的那樣僅僅是數(shù)據(jù)量問題。由于大數(shù)據(jù)本身所具有的復(fù)雜性,給其存儲(chǔ)和處理帶來了巨大挑戰(zhàn)。此外,大數(shù)據(jù)本身所隱藏的價(jià)值也是人們所關(guān)注的方面。在目前主流的大數(shù)據(jù)處理工具中,Apache Hadoop無疑是一個(gè)備受追捧的開源框架。本文將研究Hadoop大數(shù)據(jù)存儲(chǔ)和處理的解決方案,包括其基礎(chǔ)的HDFS文件系統(tǒng)及其非關(guān)系型數(shù)據(jù)庫Hbase,還有其分布式大數(shù)據(jù)處理編程框架Mapreduce。在此研究的基礎(chǔ)上,通過相關(guān)的數(shù)據(jù)預(yù)測(cè)方法建立模型,得到了相應(yīng)的預(yù)測(cè)結(jié)果。大數(shù)據(jù)時(shí)代下,其信息管理研究不僅包括其存儲(chǔ)和處理,也包括獲取包含在海量數(shù)據(jù)中的潛在價(jià)值。 關(guān)鍵詞: 大數(shù)據(jù) 信息管理 MapReduce HDFS
目錄 摘要 Abstract 1 緒論-1 1.1 背景概述-1 1.2 研究內(nèi)容-2 1.3 研究意義-2 1.4 論文結(jié)構(gòu)-3 2大數(shù)據(jù)存儲(chǔ)-4 2.1大數(shù)據(jù)存儲(chǔ)的現(xiàn)狀-4 2.2 HDFS文件系統(tǒng)概述-5 2.2.1設(shè)計(jì)理念-6 2.2.2文件操作-8 2.2.3異常處理-11 2.3 HBase簡介-12 2.3.1非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)-12 2.3.2 HBase架構(gòu)-13 2.3.1 HBase數(shù)據(jù)模型-14 3大數(shù)據(jù)處理-14 3.1 移動(dòng)數(shù)據(jù)和移動(dòng)計(jì)算-16 3.2 MapReduce編程框架-16 3.2.1 基本思想-16 3.2.2 主要功能-17 4 實(shí)戰(zhàn)大數(shù)據(jù)分析處理-19 4.1 Hadoop安裝和開發(fā)環(huán)境配置-19 4.2數(shù)據(jù)獲取和處理分析-21 4.2.1 數(shù)據(jù)來源-21 4.2.2 數(shù)據(jù)分析-21 4.3分析結(jié)果呈現(xiàn)-24 4.4 數(shù)據(jù)趨勢(shì)預(yù)測(cè)-27 4.4.1預(yù)測(cè)步驟-27 5 結(jié)論和展望-31 5.1論文主要工作與不足-32 5.2未來工作展望-32 致謝-33 參考文獻(xiàn)-34 |