一、问题

因公司业务的发展，后台架构的变更，导致测试环境（Linux）部署与管理困难成倍增长，duang的一下，增加N倍。进入正题说问题:

问题1. 测试环境包含普通用户环境、开发者用户环境，原来只需2个Wildfly，现需要15*2，30个容器，启动、停止、部署工作量巨大。
    app

    appInterface

    battle

    friend

    gexin

    msg

    online

    passport

    pay

   push

   support

   union

   upload

   webInterface

   webView
注：因公司以及其他原因，本文中的模块名、环境、数量都进行了适当的修改，此处只举例说明。

问题2. 后续模块扩展与容器增减维护工作

问题3. 部署包SVN的自动获取，自动部署

问题4. 部署完毕邮件通知

二、分析

1. 现状

a. SVN源码无权限，有固定目录取转测模块WAR包，但需要根据转测svn版本号取(最新的不一定是部署时转测的模块)

b. 转测模块不定，也许15个，也许2、3个

c. 15个模块（即15个WAR包），两环境（普通用户、开发者用户），需要30个容器

d. 根据转测模块，只需要停止对应模块所在容器，无须所有模块停止与启动

2. 分析与方案确定

1) 弃用Jenkins

a.无须自动构建：公司其他原因，测试无法获得SVN源码权限进行自动构建，Jenkins的自动化部署。

b.不够灵活：WAR的自动化部署，Jenkins虽可部署，但需要15个Job+，整体转测时用1Job统一部署，如模块转测试则需要按每个模块（每个Job）一一点击
c.工作量未减少：研发转测发布固定目录是以svn版本号发布，在部署时已经可能最新的版本号是另一个转测模块，因此需要取对应的版本号，每次改太麻烦，基本没有减少工作量。

2) 选用Shell脚本

a.脚本实现快速，随时修改

b.容器的操作都是Linux(shell)命令

~~c.自动化部署也采用shell分发与检测部署~~

~~d.邮件发送采用mail命令~~

三、解决问题

1.wildfly统一命名规则

普通用户环境：Formal-wildfly-模块名

开发者环境：DEV-wildfly-模块名

Formal-wildfly-app

Formal-wildfly-appInterface

Formal-wildfly-battle

Formal-wildfly-friend

Formal-wildfly-gexin

...

DEV-wildfly-app

DEV-wildfly-appInterface

DEV-wildfly-battle

DEV-wildfly-friend

DEV-wildfly-gexin

...

2.模块名称列表： wildfly.list

app|app

appInterface|ae

battle|b

friend|f

gexin|g

msg|m

online|o

passport|pt

pay|pay

push|ph

support|st

union|un

upload|ud

webInterface|we

webView|ww

注意：

a.第一列为模块名，用于检测wildfly容器，故需要严格注意大小写

b.第二列为启动、停止、检查脚本使用的参数缩写

c.后续扩展增加模块，只需要增加对应的容器，然后修改此文件加入模块名即可，此处解决第2个问题

3.启动Wildfly脚本（run_wildfly.sh）

#!/bin/bash

# Author:findyou

# Email:1968089885@qq.com

cDate=`date +%Y-%m-%d`

cTime=`date +%H:%M`

shellDIR="/root/shell/"

wildfly_rootDir="/data/"

conf_file="wildfly.list"

echo_tips="      "

checkBoolean=0

# 检测wildfly.list文件是否存在,不存在-则退出脚本执行

if [ ! -f ${shellDIR}${conf_file} ]; then

    echo "Not Found : ${shellDIR}${conf_file}"

    exit 1

fi

# 读wildfly.list文件

count_n=0

while read line;

do

    count_n=`expr ${count_n} + 1`                            #统计模块个数

    wildfly[$count_n]=`echo $line|cut -d '|' -f 1`           #获到模块名称

    wildfly_quick[$count_n]=`echo $line|cut -d '|' -f 2`     #获得快捷命令

done < ${shellDIR}${conf_file}

# 脚本帮助提示，并退出脚本

help_tips(){

   echo "eg: $0 [wildflyName|a]"

   echo ""

   echo "wildflyName:"

    for ((i=1; i<=${count_n}; i++));

    do

       echo "${echo_tips}${wildfly[$i]}|${wildfly_quick[$i]}"

       done

   echo ""

   exit 1

}

# 如果检测到没有传入参数，则执行help_tips方法，

if [ ! -n "$1" ] ; then

    help_tips

fi

# 将传入的 模块名称 参数赋值给para_cmd

para_cmd=$1

# 休眠方法，用于启动间隔

sleep_2(){

    #echo "${echo_tips}${echo_tips}Sleep 2 second!"

    sleep 2

}

# 循环启动Wildfly方法

run_wildfly(){

echo "Time : ${cDate} ${cTime}"

# 循环wildfly.list文件中的所有模块，根据传入参数，判断执行相应的启动

for ((i=1; i<=${count_n}; i++));

do 

# 根据脚本传入的参数，启动对应的容器，传为a则启动所有容器。

if [ "${para_cmd}" == "a" -o "${para_cmd}" == "${wildfly[$i]}" -o "${para_cmd}" == "${wildfly_quick[$i]}" ];then

    echo "Start: ${wildfly[$i]}"

    #检查 普通用户 对应容器的进程

    formal_pc=`ps -ef|grep "Formal-wildfly-${wildfly[$i]}/"|grep -v grep|wc -l`

        #容器进程数，如果不为0，则说明已启动。反之则进行容器启动

        if [ $formal_pc -ne 0  ] ; then

            echo "${echo_tips}${echo_tips}Failure: UAT is already running!" 

        else

            echo "${echo_tips}UAT Start...."

            # 进入对应的容器，启动容器

            cd ${wildfly_rootDir}Formal-wildfly-${wildfly[$i]}/bin

            nohup sh standalone.sh >/dev/null 2>&1 &

            echo "${echo_tips}Please Check file: ${wildfly_rootDir}Formal-wildfly-${wildfly[$i]}/standalone/log/server.log"

            sleep_2

        fi

        

    #检查 开发者用户 对应容器的进程

    dev_pc=`ps -ef|grep "Dev-wildfly-${wildfly[$i]}/"|grep -v grep|wc -l`    

        if [ $dev_pc -ne 0 ] ; then

            echo "${echo_tips}${echo_tips}Failure: UAT-DEV is already running!" 

        else

            echo "${echo_tips}UAT-DEV Start...."

            cd ${wildfly_rootDir}Dev-wildfly-${wildfly[$i]}/bin

            nohup sh standalone.sh >/dev/null 2>&1 &

            echo "${echo_tips}Please Check file: ${wildfly_rootDir}Dev-wildfly-${wildfly[$i]}/standalone/log/server.log"

            sleep_2

        fi

    # 记录启动模块数

    checkBoolean=`expr ${checkBoolean} + 1`

fi

done

}

# 执行run_wildfly方法

run_wildfly

# 传入了参数，但是没有找到应的模块进行启动，调help_tips

if [ ${checkBoolean} -eq 0  ];then

    help_tips

fi

说明：

1.wildfly.list须要与run_wildfly.sh放在同一目录，脚本没有采用相对路径，故run_wildfly.sh脚本中需要调整对应的目录参数shellDIR

2.命令使用，如启动app容器： ./run_wildfly.sh app

3.启动所有app容器：./run_wildfly.sh a

4.检查Wildfly是否运行脚本(check_wildfly.sh)

脚本逻辑与启动脚本一致，直接替换掉run_wildfly方法即可，但记得调用修改后的方法

check_wildfly(){

echo "Time : ${cDate} ${cTime}"

# 循环wildfly.list文件中的所有模块，根据传入参数，判断执行相应的启动

for ((i=1; i<=${count_n}; i++));

do 

# 根据脚本传入的参数，启动对应的容器，传为a则启动所有容器。

if [ "${para_cmd}" == "a" -o "${para_cmd}" == "${wildfly[$i]}" -o "${para_cmd}" == "${wildfly_quick[$i]}" ];then

    echo "Check: ${wildfly[$i]}"

    #检查 普通用户 对应容器的进程

    formal_pc=`ps -ef|grep "Formal-wildfly-${wildfly[$i]}/"|grep -v grep|wc -l`

        #容器进程数，如果不为0，则说明已启动。反之则进行容器启动

        if [ $formal_pc -eq 0  ] ; then

            echo "${echo_tips}${echo_tips}UAT not Found!"

        else

            echo "${echo_tips}UAT is running!"

        fi

        

    #检查 开发者用户 对应容器的进程

    dev_pc=`ps -ef|grep "Dev-wildfly-${wildfly[$i]}/"|grep -v grep|wc -l`    

        if [ $dev_pc -eq 0 ] ; then

            echo "${echo_tips}${echo_tips}UAT-DEV not Found!"

        else

            echo "${echo_tips}UAT-DEV is running!"

        fi

    # 记录启动模块数

    checkBoolean=`expr ${checkBoolean} + 1`

fi

done

}

说明：

1.检查所有app容器运行状态：./check_wildfly.sh a

5.停止Wildfly脚本(stop_wildfly.sh)

脚本逻辑与启动脚本一致，直接替换掉run_wildfly方法即可，但记得调用修改后的方法

stop_wildfly(){

for ((i=1; i<=${count_n}; i++));

do 

if [ "${para_cmd}" == "a" -o "${para_cmd}" == "${wildfly[$i]}" -o "${para_cmd}" == "${wildfly_quick[$i]}" ];then

    echo "Stop: ${wildfly[$i]}"

    # 检查 普通用户 对应容器的进程，得到进程号

    formal_pc=`ps -ef|grep "Formal-wildfly-${wildfly[$i]}/"|grep -v grep|awk '{print $2}'`

        if [ "$formal_pc" == "" ] ; then

            echo "${echo_tips}${echo_tips}UAT not Found!" 

        else

            # 停止进程

            kill -9 $formal_pc

            sleep_2

            # 再次检测是否已停止进程

            formal_pc1=`ps -ef|grep "Formal-wildfly-${wildfly[$i]}/"|grep -v grep|awk '{print $2}'`

            if [ "$formal_pc1" == "" ] ; then

                echo "${echo_tips}Stop UAT Success!" 

            else

                echo "${echo_tips}${echo_tips}Stop UAT Failure!"

            fi

        fi

    # 检查 开发者用户 对应容器的进程，得到进程号

    dev_pc=`ps -ef|grep "Dev-wildfly-${wildfly[$i]}/"|grep -v grep|awk '{print $2}'`

        if [ "$dev_pc" == "" ] ; then

            echo "${echo_tips}${echo_tips}UAT-DEV not Found!" 

        else

            # 停止进程

            kill -9 $dev_pc

            sleep_2

            # 再次检测是否已停止进程

            dev_pc1=`ps -ef|grep "Dev-wildfly-${wildfly[$i]}/"|grep -v grep|awk '{print $2}'`

            if [ "$dev_pc1" == "" ] ; then

                echo "${echo_tips}Stop UAT-DEV Success!" 

            else

                echo "${echo_tips}${echo_tips}Stop UAT-DEV Failure!"

            fi

        fi

    checkBoolean=`expr ${checkBoolean} + 1`

fi

done

}

说明：

1.停止所有容器：./stop_wildfly.sh a

至此，第1个问题已圆满解决！

结束语：

1.原本考虑与实现相对简单，第一版，把所有的容器路径写到文件里，读取启动与停止即可，但不利于自动化部署、WAR分发等问题处理。

2.这个版本是实际当中优化的第三个版本，相对扩展与维护简单，为自动化部署提供停止与启动脚本，也最适合我们目前的转测流程。

3.本想与自动部署一起写此文，发现所讲的内容与贴出的脚本内容过多，有时间再讲讲解决第三、四个问题，超简单的实现方式shell脚本。

4.Jenkins大多数觉得持续集成用这个很叼，完了其引入除了用发邮件功能、定时任务，其他组件基本用不上。很多人也许只是对Jenkins组件的熟悉，但完全不具备Jenkins转化提升效率的能力，维护成本与效率还不如之前手工操作。

5.思想的支撑尤为重要，可以在有限的资源里发挥出最大的功效，寻找到最优的方案。

切勿舍本求末，忘记初心！

如转载还请保留出处与作者姓名Findyou，谢谢！

秒客网

Linux 解决数量庞大wildfly容器启动与停止的脚本

一、问题

二、分析

1. 现状

2. 分析与方案确定

1) 弃用Jenkins

2) 选用Shell脚本