如何查看我的Hadoop作业历史记录和使用CDH4及纱线日志?(How do I view my H

2019-08-03 10:03发布

我下载了CDH4焦油Hadoop的用长丝和作业罚款运行,但我想不通的地方,从我的工作查看日志。 在MRv1,我只是去了JobTracker的Web应用程序,并且它有作业历史记录。 个别工作日志是为好,或将日志/ userlogs目录可以从这里访问。

在我的新纱设置(只是单个计算机上运行),我有日志目录,但没有日志/ userlogs文件夹。

当我去到ResourceManager网页,本地主机:8088,有一个“所有应用”部分,但没有条目显示在这里。 当我去JobHistory网页,本地主机:19888,没有列出任何工作。

我想知道如果有一个配置问题。 这是我的纱-site.xml中的条目:

<property>
  <name>yarn.nodemanager.local-dirs</name> 
  <value>/Users/dolan/cdh4/_hadoop_data/yarn/local</value>
</property> 
<property> 
  <name>yarn.nodemanager.log-dirs</name>
  <value>/Users/dolan/cdh4/_hadoop_data/yarn/logs</value> 
</property>
<property> 
  <name>mapreduce.jobhistory.address</name>
  <value>localhost:10020</value> 
</property>
<property> 
  <name>mapreduce.jobhistory.webapp.address</name>
  <value>localhost:19888</value> 
</property>
<property>
  <name>yarn.app.mapreduce.am.staging-dir</name>
  <value>/user</value>
</property>

调试什么的任何提示都十分赞赏。

更新:我已经检查了节点管理器日志目录,它是空的。 此外,jobhistory目录是空的。 一个奇怪的是,Hadoop的告诉我, INFO mapreduce.Job: The url to track the job: http://localhost:8080/ ,但该地址是不可用的时候,我从浏览器试试。

更新2:我注意到,每个I运行的作业具有相同作业ID(“job_local_0001”)。 这似乎是一个配置问题的地方。

Answer 1:

这听起来像这里的工作正在纱线本地,而不是运行在所有。 为了使运行纱线的作业,确保您在mapred-site.xml中有这样的:

<property>
  <name> mapreduce.framework.name</name>
  <value>yarn</value>
</property>

在一般情况下,你可能会得到通过电子邮件的CDH用户邮件列表这样的问题更快的响应。



Answer 2:

添加下面的配置到mapred-site.xml文件

<property>
  <name> mapreduce.framework.name</name>
  <value>yarn</value>
</property>
<property> 
  <name>mapreduce.jobhistory.address</name>
  <value>localhost:10020</value> 
</property>
<property> 
  <name>mapreduce.jobhistory.webapp.address</name>
  <value>localhost:19888</value> 
</property>

并删除jobhistory具体的配置为你放纱-site.xml中如。 上述从纱线-site.xml中最后两个CONFIGS



文章来源: How do I view my Hadoop job history and logs using CDH4 and Yarn?