shell脚本实现git和svn统计log代码行

时间:2021-02-11 15:34:13

实现的功能

git

根据传入的三个参数:起始统计日期、结束统计日期、git仓库地址。

脚本统计的是git仓库内的所有分支的log信息。

脚本统计的是指定时间段内、每一个提交人指定的git地址的所有分支里的提交代码行的新增情况。

其中代码行可分别统计出:新增的有效代码行数、新增的空行数、新增的注释行数。

并且脚本中还做了相应的提交历史“去重”,避免了这种情况:“某个分支是以其他分支为基础拉出来的,所以会将其他分支的git历史log一并复制,导致log历史重复了两份”,在统计时会去重,多次重复的git提交log只会算作一次提交。

 

svn

svn的统计方式与git有很大不同,svn要查看log不需要将代码checkout到本地。

svn的log命令最多只能看出,某个时间段内什么用户在什么版本号下修改了那些文件,

至于具体的修改内容,需要结合diff命令对每一个文件进行检查。

 

有相关log统计需求的朋友可以按照自己的需要修改后使用。

 

脚本内容

git

脚本布置在jenkins的job上,需要提前传入以下参数:

start_time(起始统计日期,格式为:xxxx-xx-xx xx:xx:xx)

end_time(结束统计日期,格式为:xxxx-xx-xx xx:xx:xx)

repo_url(git仓库地址,如:http://xxx.xxx.xxx.xxx/xxxxx/xxxxx.git

#clone主分支
git clone ${repo_url}
#cd进主分支文件夹
#拆分出url地址的最后一个路径,该路径是clone下来的文件夹名
newurl=${repo_url%.git};
array=(${newurl//// })  
filename=${array[${#array[*]}-1]}
cd ./$filename
cat>>chash_array
#循环切换各个分支
git branch -r | 
grep -v '\->' |
while read remote; 
    do
    #将一个分支拉下来
    git checkout "$remote";
    #遍历该分支在指定时间节点上的所有提交人
    git log  --format='%cn' --since="${start_time}" --until="${end_time}" | sort -u | while read name;
        do
        #遍历该提交人的所有提交hash码
        git log --format='%H' --committer="${name}" --since="${start_time}" --until="${end_time}" | while read chash;
            do
            #0表示当前chash不在总数组中
            flag=0
            while read line;
            do
                if [ $line = ${chash} ];then
                flag=1
                break
                fi
            done < chash_array
            #如果当前chash值在其中,则不进行log统计,否则将该chash存入总数组,并统计该chash的log
            if [ ${flag} -eq 0 ];then
                #将chash存入文件
                echo $chash>>chash_array
                #计算三种该chash的三种代码行数
                num_null=`git show ${chash} | awk '/^\+\s*$/' | wc -l`;
                num_ann=`git show ${chash} | awk '/^\+\s*\/|^\+\s*\*|^\+\s*\#|^\+\s*\<\!\-\-|^\+\s*\-\-\>/' | wc -l`;
                num_all=`git show ${chash} | awk '/^\+/' | wc -l`;
                num_code=$(($num_all-$num_null-$num_ann))
                #以下开始为有效代码行赋权值,weight为1表示权值是1,为2表示权值是1.1,为3表示权值是1.3,为4表示权值是1.5
                weight=1
                this_file=`git show ${chash} | awk '/diff.*\.js$/' | wc -l`;
                if [ $this_file -ne 0 ]; then
                    weight=2
                else
                    this_file=`git show ${chash} | awk '/diff.*\.py$|diff.*\.cpp$|diff.*\.c$|diff.*\.h$|diff.*\.go$|diff.*\.m$|diff.*\.swift$/' | wc -l`;
                    if [ $this_file -ne 0 ]; then
                        weight=3
                    else
                        this_file=`git show ${chash} | awk '/diff.*\.scala$/' | wc -l`;
                        if [ $this_file -ne 0 ]; then
                            weight=4
                        fi
                    fi
                fi
                #将所有参数传给python脚本
                
            fi
        done
    done
    echo "下一个分支"
done

 

 

svn

需提前传入以下参数:

start_time(起始统计日期,格式为:xxxx-xx-xx xx:xx:xx)

end_time(结束统计日期,格式为:xxxx-xx-xx xx:xx:xx)

trunk_repo_id(trunk仓库id号)

trunk_url(trunk仓库地址,如:svn://xxx.xxx.xxx.xxx/项目名/xxx/trunk)

branches_repo_id(branches仓库id号)

branches_url(branch仓库地址,如:svn://xxx.xxx.xxx.xxx/项目名/xxx/branches)

# 1表示当前行内容为“用户名、版本号”。2表示当前行内容为“该版本的某一个被修改了的文件的路径”
dothings=''
#当前正在统计的用户的用户名
username=''
#当前正在统计的版本号
rversion=''
#拼接出文件路径的前缀
OLD_IFS="$IFS" 
IFS="/" 
arr=($trunk_url) 
IFS="$OLD_IFS"
urlpre="svn://""${arr[2]}""/""${arr[3]}""/"
#将需要查询的svn仓库地址装入数组
svn_url_arr=("${trunk_url} ${trunk_repo_id}" "${branches_url} ${branches_repo_id}")

for i in "${svn_url_arr[@]}" ; 
do
    one=($i)
    now_url=${one[0]}
    repo_id=${one[1]}
    svn log -v -r {"$start_time"}:{"$end_time"} ${now_url} | while read line
    do
    if [ "${line}" = "------------------------------------------------------------------------" ]; 
    #如果当前行到这行,表示接下来该正则用户名与版本号了。
    then
        dothings='1'
    elif [ "${line}" = "Changed paths:" ]; 
    #如果当前行到这行,表示接下来该正则文件路径了
    then
        dothings='2'
    elif [ ${dothings} = '1' ]; 
    #正则出当前行的用户名和版本号,并赋值
    then
        OLD_IFS="$IFS" 
        IFS="|" 
        arr=($line) 
        IFS="$OLD_IFS"
        rversion=${arr[0]#r}
        username=${arr[1]}
    elif [ ${dothings} = '2' ];
    #正则当前行并拼接出路径,然后diff
    then
        fileurl=`echo ${line} | awk '/\/.*\..*/'`
        #如果不为空,则表示文件格式正确,开始diff该文件详情
        if [ -n "$fileurl" ]; then
            OLD_IFS="$IFS" 
            IFS="(" 
            arr=($line) 
            IFS="$OLD_IFS"
            fileurl=${arr[0]#*/}
            fileurl="$urlpre""${fileurl}"

            svn diff -c $rversion ${fileurl}
            #计算该文件的三种代码行数
            num_null=`svn diff -c $rversion ${fileurl} | awk '/^\+\s*$/' | wc -l`;
            num_ann=`svn diff -c $rversion ${fileurl} | awk '/^\+\s*\/|^\+\s*\*|^\+\s*\#|^\+\s*\<\!\-\-|^\+\s*\-\-\>/' | wc -l`;
            num_all=`svn diff -c $rversion ${fileurl} | awk '/^\+/' | wc -l`;
            num_code=$(($num_all-$num_null-$num_ann-1))

            #以下开始为有效代码行赋权值,weight为1表示权值是1,为2表示权值是1.1,为3表示权值是1.3,为4表示权值是1.5
            weight=1
            this_file=`svn diff -c $rversion ${fileurl} | awk '/\+\+\+.*\.js/' | wc -l`;
            if [ $this_file -ne 0 ]; then
                weight=2
            else
                this_file=`svn diff -c $rversion ${fileurl} | awk '/\+\+\+.*\.py|\+\+\+.*\.cpp|\+\+\+.*\.c|\+\+\+.*\.h|\+\+\+.*\.go|\+\+\+.*\.m|\+\+\+.*\.swift/' | wc -l`;
                if [ $this_file -ne 0 ]; then
                    weight=3
                else
                    this_file=`svn diff -c $rversion ${fileurl} | awk '/\+\+\+.*\.scala/' | wc -l`;
                    if [ $this_file -ne 0 ]; then
                        weight=4
                    fi
                fi
            fi

            #将所有参数传给python脚本

        fi
    fi
    done
done