Hadoop源码分析四远程debug调试

时间:2021-07-31 03:37:34

1、 hadoop远程debug

从文档(3)中可以知道hadoop启动服务的时候最终都是通过java命令来启动的,其本质是一个java程序。在研究源码的时候debug是一种很重要的工具,但是hadoop是编译好了的代码,直接在liunx中运行的,无法象普通的程序一样可以直接在eclipse之类的工具中直接debug运行。
对于上述情况java提供了一种远程debug的方式。

这种方式需要在java程序启动的时候添加以下参数:

-agentlib:jdwp=transport=dt_socket,server=y,address=6603,suspend=y

其中transport是指定双方的数据传输方式,server表示是否监听debuger的调试请求,address是监听端口,suspend是表示是否等待启动。

所以为了能远程debug hadoop,需要修改hadoop的启动脚本。

推荐修改bin目录下的hdfs文件进行修改

修改方式如下图:

Hadoop源码分析四远程debug调试

如上图所示,被注释掉的语句是包含远程调试的参数,未被注释的是其正常的启动参数。在这里修改还有一个好处是可以针对指定的服务进行远程debug设置。上图是针对namenode进行远程debug设置。若要对其他的服务进行远程debug,那么只需修改对应节点的hdfs文件中与该服务名称对应的参数便可。
修改完成后,使用sbin目录下的脚本启动便可。

启动成功后,便可以使用eclipse等工具进行远程调试。

下面以eclipse为例

首先在eclipse的代码框中点击右键,在弹出的选项框中选择debug as,在其弹出的选项框中选择debug configurations。

打开debug的配置页面

如下图:

Hadoop源码分析四远程debug调试

然后双击remote java application(或者点击右键,然后选择new configuration)

界面如下:

Hadoop源码分析四远程debug调试

其中,name可以自定义,host需要写启动远程debug服务器的地址,prot需要写上述参数中的端口。若无误便可点击下方的debug按钮,开始debug。

以上就是Hadoop远程debug调试的详细内容,本系列下一篇文章传送门Hadoop源码分析五hdfs架构原理剖析更多关于Hadoop的资料请持续关注服务器之家其它相关文章!

原文链接:https://blog.csdn.net/qq_39210987/article/details/113922213