【原】Storm环境搭建

时间:2022-05-21 00:47:37

2.Storm环境搭建

单机

...

集群

...

搭建Storm开发环境

搭建Storm开发环境主要概括为以下两步:

1.下载Storm发行稳定版,然后解压,最后把解压后的bin/文件所在目录添加到你的系统环境变量中。

2.为了能在远程集群环境中启动或停止topologies ,需要在~/.storm/storm.yaml文件中配置集群信息。

什么是开发环境

Storm有两种操作模式:本地模式和远程模式。在本地模式中,在本地机器中的进程中就可以开发和测试topologies。在远程模式中,是将topologies提交到远程的集群中执行。

Storm开发环境已安装好了一切,所以可以在本地模式中进行开发和测试,然后将topologies 打jar包发送到集群中执行,可通过submit提交或kill杀死该topology

让我们简要了解一下本地模式和集群模式的关系吧。Storm集群是由命名为“Nimbus”的master节点管理的,其他节点和Nimbus进程进行通信,实现提交代码(打成jar包)和集群中执行topologies 的任务,Nimbus负责集群中代码的分发和安排workers运行代码。你可以通过命令行客户端程序storm来 和Nimbus通信,该客户端只适合远程模式,不适合本地模式。

在本地机器上安装 Storm

如果要从本地机器上直接向远程集群提交拓扑,你需要在本地机器上安装 Storm 程序。本地的 Storm 程序可以提供与远程集群交互的 storm 客户端。在安装本地 Storm 之前,你需要下载一个 Storm 安装程序并将其解压到你的电脑的某个位置。然后将 Storm 的 bin/ 目录添加到你的 PATH 环境变量中,确保 bin/storm 脚本可以直接运行。

在本地机器上安装的 Storm 仅能用于与远程集群的交互。对于本地模式下的开发、测试拓扑,推荐使用 Maven 来将 Storm 添加到你的项目的开发依赖中。关于 Maven 的使用请参考此文。

在远程集群上开始/终止拓扑的运行

在上一步中我们已经安装好了本地的 storm 客户端。接下来就需要告诉客户端需要连接哪一个 Storm 集群。这可以通过在 ~/.storm/storm.yaml 文件中填写 Storm 集群的主节点的 host 地址来实现:

nimbus.seeds: ["123.45.678.890"]