Hadoop大數(shù)據(jù)開發(fā)技術(shù)入門資源簡(jiǎn)介
Hadoop是Apache軟件基金會(huì)旗下的一個(gè)開源分布式計(jì)算平臺(tái)。以Hadoop分布式文件系統(tǒng)(Hadoop Distributed File System,HDFS)和(Google MapReduce的開源實(shí)現(xiàn))為核心的
Hadoop為用戶提供了系統(tǒng)底層細(xì)節(jié)透明的分布式基礎(chǔ)架構(gòu)。HDFS的高容錯(cuò)性、高伸縮性等優(yōu)點(diǎn)允許用戶將Hadoop部署在低廉(low-cost)的硬件上,形成分布式系統(tǒng);
MapReduce分布式編程模型允許用戶在不了解分布式系統(tǒng)底層細(xì)節(jié)的情況下并發(fā)并行應(yīng)用程序。所以用戶可以利用集群的Hadoop輕松地組織計(jì)算機(jī)資源,
從而搭建自己的分布式計(jì)算平臺(tái),并且可以充分利用集群的計(jì)算和存儲(chǔ)能力,完成海量數(shù)據(jù)的處理。
Hadoop是一個(gè)開源框架,可編寫和運(yùn)行分布式應(yīng)用處理大規(guī)模數(shù)據(jù)。分布式計(jì)算是一個(gè)寬泛并且不斷變化的領(lǐng)域。
方便Hadoop運(yùn)行在由一般商用機(jī)器構(gòu)成的大型集群上,或者云計(jì)算服務(wù)上,比如EC2。
健壯Hadoop致力于在一般商用硬件上運(yùn)行,其架構(gòu)假設(shè)硬件會(huì)頻繁失效,Hadoop可以從容地處理大多數(shù)此類故障。
可擴(kuò)展Hadoop通過增加集群節(jié)點(diǎn),可以線性地?cái)U(kuò)展以處理更大的數(shù)據(jù)集。
簡(jiǎn)單Hadoop允許用戶快速編寫高效的并行代碼。
Hadoop框架的核心是HDFS和MapReduce。其中 HDFS 是分布式文件系統(tǒng),MapReduce 是分布式數(shù)據(jù)處理模型和執(zhí)行環(huán)境。掌握了這兩部分,也就掌握了Hadoop最核心的東西。
課程目錄
課時(shí)1Hadoop起源介紹.mp4
課時(shí)2Hadoop生態(tài)圈介紹.mp4
課時(shí)3Hadoop基本組件介紹.mp4
課時(shí)4Hadoop組成框架介紹.mp4
課時(shí)5Hadoop安裝.mp4
課時(shí)6Eclipse環(huán)境搭建.mp4
課時(shí)7HDFS組件及備份機(jī)制介紹以及讀寫文件流程介紹.mp4
課時(shí)8Shell命令介紹.mp4
課時(shí)9HDFS Java API介紹(一).mp4
課時(shí)10HDFS Java API介紹(二).mp4
課時(shí)11HDFS新特性介紹.mp4
課時(shí)12YARN組件介紹以及YARN框架上job執(zhí)行流程介紹.mp4
課時(shí)13MR編程模型總體介紹.mp4
課時(shí)14Shuffle階段Map端執(zhí)行流程介紹.mp4
課時(shí)15Shuffle階段Reduce端執(zhí)行流程介紹.mp4
課時(shí)16WordCount案例總體介紹.mp4
課時(shí)17MapReduce中數(shù)據(jù)類型介紹.mp4
課時(shí)18MR中自定義數(shù)據(jù)類型編寫.mp4
課時(shí)19案例介紹以及類的編寫.mp4
課時(shí)20Shuffle組件Partitioner自定義介紹.mp4
課時(shí)21Shuffle組件Combiner以及Grouping自定義介紹.mp4
課時(shí)22二次排序?qū)崿F(xiàn).mp4
課時(shí)23順序式MR組合任務(wù)介紹.mp4
課時(shí)24依賴關(guān)系組合式MR任務(wù)介紹.mp4
課時(shí)25鏈?zhǔn)組R任務(wù)介紹.mp4
課時(shí)26MapSideJoin介紹.mp4
課時(shí)27ReduceSideJoin介紹.mp4
課時(shí)28半連接介紹.mp4
課時(shí)29倒排索引實(shí)現(xiàn).mp4