能看懂博主我此博文,相信你已经有了一定基础了。
对于本地模式、伪分布模式和全分布模式的概念,这里,我不多赘述。太多资料和博客,随便在网上一搜就好。
比如《hadoop实战 第二版》陆嘉恒老师等。
我这里呢,是再次挖掘深入。
我们知道,如伪分布模式或全分布式模式,里有着很多的java进程(这个,可用jps查看)。有过动手试验的都知道,
这两种模式,速度明显比本地模式要快,为什么呢?
答:原因在于,本地独立模式将每个单独任务执行的信息都打印在屏幕上,而在伪分布模式和全分布式模式下,这些信息只被写入在运行主机的日志文件中。