软件名: code_analyzer
使用c语言 pcre正则库分析源码文件,包括文件中的头文件、宏定义、函数。
用途:
无聊时,可以用来打发下时间。
演示:
对于本源程序的分析结果如下:
##########################头文件########################
1.头文件: stdio.h
2.头文件: stdlib.h
3.头文件: string.h
4.头文件: pcre.h
##########################宏##########################
1.宏原型: #define OVECCOUNT 30
宏名: OVECCOUNT
值: 30
2.宏原型: #define EBUFLEN 128
宏名: EBUFLEN
值: 128
3.宏原型: #define BUFLEN 10024
宏名: BUFLEN
值: 10024
########################函数#########################
1.函数原型: int main(int argc, char *argv[])
函数返回值: int
函数名: main
参数: int argc, char *argv[]
2.函数原型: void read_file(char *filename, char *buf)
函数返回值: void
函数名: read_file
参数: char *filename, char *buf
3.函数原型: int regex_f(char *src, char *pattern, regex_buf *re_buf, regex_flag flag)
函数返回值: int
函数名: regex_f
参数: char *src, char *pattern, regex_buf *re_buf, regex_flag flag
使用方法:
命令行使用方法是:
参数1:源程序文件, 参数2:输出文件名(可选项,默认out.txt)
源码:
//********************************************************************************
// Author: tanhehe
// DateTime: Mon Aug 26 19:34:47 2013
// SearchMe: http://www.cnblogs.com/tanhehe
// email: 443016215@qq.com
// 程序名: CodeAnalyzer
// Description: 代码分析助手
//
//******************************************************************************** #include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <pcre.h> #define OVECCOUNT 30
#define EBUFLEN 128
#define BUFLEN 10024 typedef enum regex_flag {REG_FUNCTION, REG_MACRO, REG_HEADERS, REG_VARIABLES}regex_flag; union regex_content {
char func[][][]; /* 存储函数信息 */
char macr[][][]; /* 存储宏信息 */
char head[][][]; /* 存储头文件信息 */
}; typedef struct regex_buf {
int cn;
regex_flag flag;
union regex_content buf;
}regex_buf; void read_file(char *filename, char *buf);
int regex_f(char *src, char *pattern, regex_buf *re_buf, regex_flag flag); char buf[BUFLEN]; int main(int argc, char *argv[]) {
char *ifilename = "main.c";
char *ofilename = "out.txt";
char *pattern_function = "((\\w+\\s+\\*?)(?#返回值)\\s*+(\\w+)(?#函数名)\\s*\\(((.(?![\"=><])(?#参数内不能包含引号))*)(?#参数)\\))\\s*{";
char *pattern_macro = "#\\s?define\\s+(\\w+)\\s+(.+)";
//char *pattern_variables = "(\\w+)\\s+(\\w+);";
char *pattern_headers = "#\\s*include\\s*<(.+)>"; FILE *fp;
regex_buf re_buf;
int i; if(argc < ) {
fprintf(stderr, "缺少源文件\n");
return ;
}
if(argc >= ) {
ifilename = argv[];
}
if(argc >= ) {
ofilename = argv[];
} if((fp = fopen(ofilename, "w")) == NULL) {
fprintf(stderr, "open file error!\n");
} read_file(ifilename, buf);
printf("成功读取%s......\n", ifilename); fprintf(fp, "\n##########################头文件########################\n\n");
if(regex_f(buf, pattern_headers, &re_buf, REG_HEADERS) == ) {
for(i=; i<re_buf.cn; i++) {
fprintf(fp, "%d.头文件: %20s\n", i+, re_buf.buf.head[i][]);
}
}
printf("已分析完毕头文件......\n"); fprintf(fp, "\n##########################宏##########################\n\n");
if(regex_f(buf, pattern_macro, &re_buf, REG_MACRO) == ) {
for(i=; i<re_buf.cn; i++) {
fprintf(fp, "%d.宏原型: %s\n", i+, re_buf.buf.macr[i][]);
fprintf(fp, "宏名: %20s\n值: %20s\n", re_buf.buf.macr[i][], re_buf.buf.macr[i][]);
}
}
printf("已分析完毕宏定义......\n"); fprintf(fp, "\n########################函数#########################\n\n"); if(regex_f(buf, pattern_function, &re_buf, REG_FUNCTION) == ) {
for(i=; i<re_buf.cn; i++) {
fprintf(fp, "%d.函数原型: %s\n", i+, re_buf.buf.func[i][]);
fprintf(fp, "函数返回值: %10s\n函数名: %15s\n参数: %20s\n\n", re_buf.buf.func[i][], re_buf.buf.func[i][], re_buf.buf.func[i][]);
}
} printf("已分析完毕函数......\n"); fclose(fp);
printf("已成功写入%s......\n", ofilename);
return ;
} void read_file(char *filename, char *buf) {
FILE *fp;
char temp[]; if((fp = fopen(filename, "r")) == NULL) {
fprintf(stderr, "readerr!\n");
exit();
} buf[] = '\0'; while(fgets(temp, sizeof(temp)-, fp)) {
strcat(buf, temp);
}
} int regex_f(char *src, char *pattern, regex_buf *re_buf, regex_flag flag) {
pcre *re;
const char *error;
int erroffset;
int ovector[OVECCOUNT];
int rc, i;
int cn = ; re_buf->flag = flag; re_buf->cn = ; re = pcre_compile(pattern, , &error, &erroffset, NULL);
if(re == NULL) {
printf("PCRE compilation failed at offset %d: %s\n", erroffset, error);
return ;
} rc = pcre_exec(re, NULL, src, strlen(src), , , ovector, OVECCOUNT);
if(rc < ) {
if(rc == PCRE_ERROR_NOMATCH) printf("Sorry, no match ...\n");
else printf("Matching error %d\n", rc);
free(re);
return -;
} for(i=; i<rc; i++) {
char *substring_start = src + ovector[*i];
int substring_length = ovector[*i+]-ovector[*i]; //printf("%2d: %.*s\n", i, substring_length, substring_start);
switch(flag) {
case REG_MACRO:
sprintf(re_buf->buf.macr[cn][i], "%.*s", substring_length, substring_start);
break;
case REG_FUNCTION:
sprintf(re_buf->buf.func[cn][i], "%.*s", substring_length, substring_start);
break;
case REG_HEADERS:
sprintf(re_buf->buf.head[cn][i], "%.*s", substring_length, substring_start);
break;
// 扩展
}
}
cn++; for(;;) {
int start_offset = ovector[];
rc = pcre_exec(re, NULL, src, strlen(src), start_offset, , ovector, OVECCOUNT); if(rc == PCRE_ERROR_NOMATCH) { /* 匹配完毕 */
break;
}
else if(rc < ) { /* 匹配错误 */
//printf("Matching error %d\n", rc);
pcre_free(re);
return ;
}
else if(rc == ) { /* 匹配, 但空间不足 */
rc = OVECCOUNT/;
printf("ovector only has room for %d captured substring\n", rc-);
return ;
} for(i=; i<rc; i++) {
char *substring_start = src + ovector[*i];
int substring_length = ovector[*i+] - ovector[*i];
// printf("%2d: %.*s\n", i, substring_length, substring_start);
switch(flag) {
case REG_MACRO:
sprintf(re_buf->buf.macr[cn][i], "%.*s", substring_length, substring_start);
break;
case REG_FUNCTION:
sprintf(re_buf->buf.func[cn][i], "%.*s", substring_length, substring_start);
break;
case REG_HEADERS:
sprintf(re_buf->buf.head[cn][i], "%.*s", substring_length, substring_start);
break;
// 扩展
}
}
cn++;
} pcre_free(re); re_buf->cn = cn;
return ;
}
说明 :
因为在windows下,配置pcre库未成功,所以不打算弄个windows版本了。只有linux版本.
其实呢, 这个软件和上一个 是我目标软件中的两个功能。现在把他们单独实现。随着以后的学习,有能力时,会继续完成其他功能,然后整合在一起。