如何进行mr与spark的比较,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。
mr目前不支持DAG计算模型,Tez尝试做这样的优化,但还不成熟。
spark 1.2.0之前的版本,shuffle有问题,不够稳定,1.2.0使用了netty4,据称解决了问题,还没有进行尝试。
spark生态圈更具优势,spark sql、spark streaming、spark graphx、spark mllib都基于spark core,之间可以无缝串联。
spark更方便,spark-shell可以很快地进行一些原型验算。
hadoop更heavy也更稳定。
看完上述内容,你们掌握如何进行mr与spark的比较的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注天达云行业资讯频道,感谢各位的阅读!