遇到的问题描述:在hadoop上面执行程序,程序运行之后能够正常执行。一切似乎都是正常的,然而过了一段时间之后程序便开始阻塞直到程序超时退出(如下)。

14/08/19 21:17:51 INFO mapred.JobClient: map 99% reduce 71%
14/08/19 21:17:54 INFO mapred.JobClient: map 99% reduce 75%
14/08/19 21:17:57 INFO mapred.JobClient: map 99% reduce 79%
14/08/19 21:18:00 INFO mapred.JobClient: map 99% reduce 83%
14/08/19 21:18:03 INFO mapred.JobClient: map 99% reduce 87%
14/08/19 21:18:06 INFO mapred.JobClient: map 99% reduce 91%

出现这个问题是因为程序出现了一些异常,导致task执行失败,然而hadoop并不退出也不重启task。

异常一:程序玻本身的错误

attempt_201408192045_0002_m_000196_2: [2014-08-19 21:16:44 WARN ] [main] (org.apache.hadoop.mapred.Child:291) - Error running child
attempt_201408192045_0002_m_000196_2: java.io.IOException: Index: 0, Size: 0
attempt_201408192045_0002_m_000196_2: at com.ict.hadoop.WXExtraction$Map.map(WXExtraction.java:61)
attempt_201408192045_0002_m_000196_2: at com.ict.hadoop.WXExtraction$Map.map(WXExtraction.java:1)
attempt_201408192045_0002_m_000196_2: at org.apache.hadoop.mapred.MapRunner.run(MapRunner.java:50)
attempt_201408192045_0002_m_000196_2: at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:391)
attempt_201408192045_0002_m_000196_2: at org.apache.hadoop.mapred.MapTask.run(MapTask.java:325)
attempt_201408192045_0002_m_000196_2: at org.apache.hadoop.mapred.Child$4.run(Child.java:270)
attempt_201408192045_0002_m_000196_2: at java.security.AccessController.doPrivileged(Native Method)
attempt_201408192045_0002_m_000196_2: at javax.security.auth.Subject.doAs(Subject.java:416)
attempt_201408192045_0002_m_000196_2: at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1127)
attempt_201408192045_0002_m_000196_2: at org.apache.hadoop.mapred.Child.main(Child.java:264)
attempt_201408192045_0002_m_000196_2: Caused by: java.lang.IndexOutOfBoundsException: Index: 0, Size: 0
attempt_201408192045_0002_m_000196_2: at java.util.ArrayList.rangeCheck(ArrayList.java:571)
attempt_201408192045_0002_m_000196_2: at java.util.ArrayList.get(ArrayList.java:349)
attempt_201408192045_0002_m_000196_2: at com.ict.wxparser.parser.WXParser.getMsgContent(WXParser.java:188)
attempt_201408192045_0002_m_000196_2: at com.ict.wxparser.parser.WXParser.parseLine(WXParser.java:137)
attempt_201408192045_0002_m_000196_2: at com.ict.hadoop.WXExtraction$Map.map(WXExtraction.java:57)
attempt_201408192045_0002_m_000196_2: ... 9 more
attempt_201408192045_0002_m_000196_2: [2014-08-19 21:16:44 INFO ] [main] (org.apache.hadoop.mapred.Task:956) - Runnning cleanup for the task
14/08/19 21:17:18 INFO mapred.JobClient: Task Id : attempt_201408192045_0002_m_000196_3, Status : FAILED
java.io.IOException: Index: 0, Size: 0
at com.ict.hadoop.WXExtraction$Map.map(WXExtraction.java:61)
at com.ict.hadoop.WXExtraction$Map.map(WXExtraction.java:1)
at org.apache.hadoop.mapred.MapRunner.run(MapRunner.java:50)
at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:391)
at org.apache.hadoop.mapred.MapTask.run(MapTask.java:325)
at org.apache.hadoop.mapred.Child$4.run(Child.java:270)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:416)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1127)
at org.apache.hadoop.mapred.Child.main(Child.java:264)
Caused by: java.lang.IndexOutOfBoundsException: Index: 0, Size: 0
at java.util.ArrayList.rangeCheck(ArrayList.java:571)
at java.util.ArrayList.get(ArrayList.java:349)
at com.ict.wxparser.parser.WXParser.getMsgContent(WXParser.java:188)
at com.ict.wxparser.parser.WXParser.parseLine(WXParser.java:137)
at com.ict.hadoop.WXExtraction$Map.map(WXExtrac

解决这个问题的关键在于修改代码使得程序任务能够正常执行。

异常二:org.apache.hadoop.mapred.Child: Error running child : java.lang.OutOfMemoryError:   unable to create new native thread

这个问题说明程序的内存已经溢出,这时候会抛出溢出异常,并导致程序执行失败。

解决方法:

1. 增大hadoop-env.sh 中HADOOP_HEAPSIZE的值

2 .增大 mapred-site.xml 中mapred.child.java.opts的值(默认为200M)

<property>
<name>mapred.child.java.opts</name>
<value>-Xmx2048m</value>
</property>

3. 减小 mapred-site.xml中mapred.tasktracker.map.tasks.maximumde和mapred.tasktracker.reduce.tasks.maximum的值

<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>15</value>
</property>

最新文章

  1. python访问MS SqlServer(通过pyodbc)
  2. 关于ThinkPHP3.2框架接收不到json数据的解决办法
  3. spring batch部分
  4. Laravel框架数据库CURD操作、连贯操作
  5. Oracle 数据类型映射C#
  6. web医疗影像浏览demo及地址
  7. PCL—低层次视觉—点云滤波(初步处理)
  8. C#多线程学习(一) 多线程的相关概念
  9. 嵌入式linux加载引导内核和根文件系统的方法
  10. poj3461 Oulipo
  11. Spring Boot 系列(三)属性配置&amp;自定义属性配置
  12. NYOJ--32--SEARCH--组合数
  13. RDB持久化
  14. mac安装tensorflow
  15. adb devices 找不到设备
  16. js操作BOM对象
  17. vue页面绑定数据,渲染页面时会出现页面闪烁
  18. 洛谷P1781宇宙总统题解
  19. 以Windows服务方式运行ASP.NET Core程序【转载】
  20. python3.5安装Numpy、mayploylib、opencv等额外库

热门文章

  1. 如何修改SQL SERVER服务器的端口
  2. CSS之viewport 2
  3. Apache与Tomcat的整合
  4. 利用JDBC连接MySQL并使用MySQL
  5. 2.openstack之mitaka搭建控制节点数据库和消息队列
  6. yii2中textarea中的默认值设置
  7. HDU 5813 Elegant Construction(优雅建造)
  8. C# &lt;%@ Register %&gt;指令
  9. dede模板完全控制攻略
  10. 本来运行的好的Ajax.dll怎么突然不起作用了
  11. Android 添加系统服务
  12. mysql 交叉表
  13. Python中类的运算符重载
  14. bzoj1212
  15. .net 链接ORACLE的安装包
  16. Android获取设备採用的时间制式(12小时制式或24小时制式)
  17. 面试 15:顺时针从外往里打印数字(剑指 Offer 第 20 题)
  18. Scala 上下文界定
  19. 网页使用思源字体 CSS
  20. Spring注解之@Transactional对于事务异常的处理