首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 服务器 > 云计算 >

MapReduce调度与施行原理之作业提交

2013-09-10 
MapReduce调度与执行原理之作业提交前言:本文旨在理清在Hadoop中一个MapReduce作业(Job)在提交到框架后的

MapReduce调度与执行原理之作业提交

前言:本文旨在理清在Hadoop中一个MapReduce作业(Job)在提交到框架后的整个生命周期过程,权作总结和日后参考,如有问题,请不吝赐教。本文不涉及Hadoop的架构设计,如有兴趣请参考相关书籍和文献。在梳理过程中,我对一些感兴趣的源码也会逐行研究学习,以期强化基础。
作者:Jaytalent
开始日期:2013年9月9日参考资料:【1】《Hadoop技术内幕--深入解析MapReduce架构设计与实现原理》董西成                  【2】Hadoop 1.0.0 源码
                            【3】《Hadoop技术内幕--深入解析Hadoop Common和HDFS架构设计与实现原理》蔡斌 陈湘萍一个MapReduce作业的生命周期大体分为5个阶段【1】:1. 作业提交与初始化2. 任务调度与监控3. 任务运行环境准备4. 任务执行5. 作业完成现逐一学习。由于作业提交是在客户端完成,而初始化在JobTracker完成,本文只关注前者,后者留待下一篇文章学习研究。一、作业提交与初始化以WordCount作业为例,先看作业提交的代码片段:
    // Write job file to JobTracker's fs            FSDataOutputStream out =        FileSystem.create(fs, submitJobFile,           new FsPermission(JobSubmissionFiles.JOB_FILE_PERMISSION));    try {       jobCopy.writeXml(out);     } finally {       out.close();     }
至此,作业文件上传才算正式完毕。
接下来,作业将被提交到JobTracker,请关注下篇文章:MapReduce调度与执行原理之作业初始化





热点排行