Big Whale任务调度系统-其他下载

【文件属性】：

文件名称：Big Whale任务调度系统-其他

文件大小：3.99MB

文件格式：ZIP

更新时间：2024-07-02 05:56:43

BigWhale 巨鲸任务调度平台分布式计算任务调度系统

巨鲸任务调度平台为美柚大数据研发的分布式计算任务调度系统，提供Spark、Flink等批处理任务的DAG执行调度和流处理任务的状态监测调度，并具有重复应用检测、大内存应用检测等功能。服务基于Spring Boot 2.0开发，打包后即可运行。环境准备： Java 1.8+ Mysql 5.1.0+ 安装： 1、创建数据库：big-whale 2、运行数据库脚本：big-whale.sql 3、根据Spring Boot环境，配置相关数据库账号密码，以及SMTP信息 4、配置：big-whale.properties 配置项说明 ssh.user: 拥有脚本执行权限的ssh远程登录用户名（平台会将该用户作为统一的脚本执行用户） ssh.password: ssh远程登录用户密码 dingding.enabled: 是否开启钉钉告警 dingding.watcher-token: 钉钉公共群机器人Token yarn.app-memory-threshold: Yarn应用内存上限（单位：MB），-1禁用检测 yarn.app-white-list: Yarn应用白名单列表（列表中的应用申请的内存超过上限，不会进行告警） 5、修改：$FLINK_HOME/bin/flink，参考：flink（因flink提交任务时只能读取本地jar包，故需要在执行提交命令时从hdfs上下载jar包并替换脚本中的jar包路径参数） 6、打包：mvn clean package 启动： 1、检查端口17070是否被占用，被占用的话，关闭占用的进程或修改项目端口号配置重新打包 2、拷贝target目录下的big-whale.jar，执行命令：java -jar big-whale.jar 初始配置 1、打开：http://localhost:17070 2、输入账号admin，密码admin 3、点击：权限管理->用户管理，修改当前账号的邮箱为合法且存在的邮箱地址，否则会导致邮件发送失败 4、添加集群集群管理->集群管理->新增 “yarn管理地址”为Yarn ResourceManager的WEB UI地址 “程序包存储目录”为程序包上传至hdfs集群时的存储路径，如：/data/big-whale/storage “支持Flink任务代理用户”“流处理任务黑名单”和“批处理任务黑名单”为内部定制的任务分配规则，勿填 5、添加代理集群管理->代理管理->新增可添加多个实例（仅支持IP地址，可指定端口号，默认为22），执行脚本的时候会随机选择一个实例执行，在实例不可达的情况下，会继续随机选择下一个实例，在实例均不可达时执行失败选择集群后，会作为该集群下提交Spark或Flink任务的代理之一 6、添加集群用户集群管理->集群用户->新增该配置的语义为：平台用户在所选集群下可以使用的Yarn资源队列（--queue）和代理用户（--proxy-user） 7、添加计算框架版本集群管理->版本管理->新增同一集群下不同版本的Spark或Flink任务的提交命令可能有所不同，如Spark 1.6.0版本的提交命令为spark-submit，Spark 2.1.0版本的提交命令为spark2-submit

立即下载

秒客网

Big Whale任务调度系统-其他

网友评论

相关文章