这篇文章主要介绍“怎么安装配置MapReduce”,在日常操作中,相信很多人在怎么安装配置MapReduce问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么安装配置MapReduce”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
MapReduce 的优势在于处理大规模数据集
win10 安装hadoop 3.1.2
win10 安装hadoop 3.1.2
hadoop Linux安装配置(ubuntu 18.04 hadoop3.1.2)
解压 tar.gz
配置JAVA_HOME
配置HADOOP_HOME ,PATH等
tar -zxvf hadoop-3.1.2.tar
vim .bashrc
export JAVA_HOME
export PATH=$PATH:${JAVA_HOME}/bin
export HADOOP_HOME
export PATH=$PATH:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin
hdoop version 验证是否成功
三种模式
配置ssh
ssh-keygen -t rsa -p '' -f ~/.ssh/id_rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
ssh localhost #测试
api 版本差异
示例代码 github
hadoop 权威指代码
横向扩展
数据流
输入数据 MapReduce 程序 配置信息
Hadoop 将作业分成若干个任务来执行,并通过 YARN进行调度。如果一个任务失败,它将在另一个不同的节点上自动重新调度运行
Hadoop将MapReduce 的输入数据划分成等长的小数据块,成为输入分片。每个分片构建一个map任务
分片大小要合适,一个合理分片大小趋向于HDFS一个块的大小默认128MB
Hadoop 在存储有输入数据(HDFS中的数据)的节点上运行map任务,可获得最佳性能,因为不需要使用带宽资源
map任务将输出写入本地硬盘而非HDFS,因为是中间结果
混洗?
combiner 函数
hadoop Streaming
到此,关于“怎么安装配置MapReduce”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注天达云网站,小编会继续努力为大家带来更多实用的文章!