hadoop教程

本篇幅主要带给大家了解认识hadoop、学习一些hadoop的基本理论与概念,以及进行实战部署hadoop。本篇章的主要内容有:

1、初识hadoop:介绍hadoop的发展,应用场景和它的优势所在。

2、hadoop vs 其它系统:介绍hadoop作为数据存储、分析的分布式系统对比其它系统(如SQL数据库、网格计算、志愿计算等)有哪些优势。

3、Hadoop HDFS文件系统介绍:介绍hadoop文件系统HDFS相关基本概念和理论,以及HDFS文件系统的特点。

4、hadoop 详细安装步骤:介绍hadoop是如何进行安装,安装运行它的先行条件以及安装的详细步骤。

5、hadoop不同版本区别:介绍hadoop不同版本的区别。

6、hadoop hdfs 命令行客户端常用命令:介绍hadoop hdfs 命令行客户端(shell)的常用使用命令。

7、web界面访问hadoop hdfs:介绍hadoop系统自带hdfs的web管理界面。

8、idea 访问hadoop hdfs方法:介绍idea是如何通过插件访问hadoop hdfs文件系统的。

9、idea 搭建hadoop开发环境:介绍idea搭建hadoop的开发环境。

10、java Api操作hdfs文件系统:介绍一些常用的java api操作hadoop hdfs文件系统

11、MapReduce介绍:介绍MapReduce设计思想,MapReduce是一种分布式计算模型,通过实现map()和reduce()两个函数实现分布式计算。

12、hadoop的Mapreduce运行机制(一):介绍hadoop1.0中Mapreduce运行机制

13、hadoop的Mapreduce运行机制(二):介绍hadoop2.0中Mapreduce运行机制,对比hadoop1.0做了什么改进。

14、Mapreduce中Map任务的运行机制:介绍Mapreduce中Maptask(map任务)是如何运行的。