MapReduce应该如何应用开发,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。
用于配置的API
配置开发环境
本地运行测试数据
在集群上运行
打包作业
启动作业
作业调试
通过打印语句
计数器 可以衡量问题的严重程度
日志
远程调试
作业调优
mapper 的数量
reducer 的数量
combiner
中间值的压缩
自定义序列
调整 shuffle
MapReduce 的工作流
通常是增加更多的作业,而不是增加作业的复杂度
对于更复杂的问题,可考虑使用Pig, hive, Cascading, Crunch 或Spark
JobControl
Apache Oozie 是一个运行工作流的系统,该工作流由相互依赖的作业组成
看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注天达云行业资讯频道,感谢您对天达云的支持。