flex词法解析

时间:2023-03-09 14:46:25
flex词法解析

例子1、从标准输入的字数、单词、行数统计

%{
#include <string.h>
int chars = 0;
int lines = 0;
int words = 0;
%} %%
[a-zA-Z]+ { chars += strlen(yytext); words++; }
\n { lines++; }
. { chars++; } %% int main(int argc, char** argv)
{
yylex();
printf("chars=%d,words=%d,lines=%d\n",chars,words,lines); return 0;
}

 对应的Makefile文件:

test:wc.l
flex wc.l
gcc -W -o test lex.yy.c
clean:
rm -rf test lex.yy.o

 出现错误信息:

[root@typhoeus79 flex]# make
flex wc.l
gcc -W -o test lex.yy.c
/tmp/ccSylYmr.o: In function `yylex':
lex.yy.c:(.text+0x413): undefined reference to `yywrap'
/tmp/ccSylYmr.o: In function `input':
lex.yy.c:(.text+0xcb8): undefined reference to `yywrap'
collect2: ld returned 1 exit status
make: *** [test] Error 1

解决方案1:添加设置noyywrap设置 ,

%option noyywrap

解决方案2:设置绑定flex对应的库:

gcc -W -o test lex.yy.c -lfl

  

例子2、从一个文件中读取分析的内容,按照字母组成、数字、空格以及换行符进行区分

[root@typhoeus79 wc]# more test.l
/*默认是从标准输入输出读取,设置该选项支持从文件读取*/
%option noyywrap
%{
%} %% [a-zA-Z]+ { printf("CHAR Match=%s\n",yytext);}
\n { printf("Enter Match=%s\n",yytext);}
[0-9]+ { printf("Digitals Match=%s\n",yytext); }
[ \t]* { printf("SPACE Match=%s\n",yytext); } %% main(int argc,char ** argv)
{
int i; if(argc<2)
{
yylex();
return 0;
} for(i=1; i < argc; i++)
{
FILE *f = fopen(argv[i],"r"); if(!f){
perror(argv[i]);
return (1);
} //yyrestart使词法分析器从f中读取标准输入文件
yyrestart(f);
yylex();
fclose(f); } return 0; }

测试:

[root@typhoeus79 wc]# more Makefile
test:lex.yy.c
flex test.l
gcc -W -o test lex.yy.c
[root@typhoeus79 wc]#
[root@typhoeus79 wc]# make
flex test.l
gcc -W -o test lex.yy.c
[root@typhoeus79 wc]# more tmp
aaaee AAQQZZ
CCDD 1234
56
[root@typhoeus79 wc]# ./test tmp
CHAR Match=aaaee
SPACE Match=
CHAR Match=AAQQZZ
Enter Match= CHAR Match=CCDD
SPACE Match=
Digitals Match=1234
Enter Match= Digitals Match=56
Enter Match= [root@typhoeus79 wc]#

从输出中可以看出从文件逐个读取,按照模式最大匹配,并存储在yytext中。

例子3:模拟wc的简单例子

[root@typhoeus79 wc]# more wc.l
/*默认是从标准输入输出读取,设置该选项支持从文件读取*/
%option noyywrap %{
int chars = 0;
int lines = 0;
int words = 0; int totchars = 0;
int totlines = 0;
int totwords = 0;
%} %% [a-zA-Z]+ { words++; chars += strlen(yytext); }
\n { lines++; chars++;}
. { chars++ ;} %% main(int argc,char ** argv)
{
int i; if(argc<2)
{
yylex();
printf("%8d%8d%8d\n",lines,words,chars);
return 0;
} for(i=1; i < argc; i++)
{
FILE *f = fopen(argv[i],"r"); if(!f){
perror(argv[i]);
return (1);
} //yyrestart使词法分析器从f中读取标准输入文件
yyrestart(f);
yylex();
fclose(f); printf("%8d%8d%8d\n",lines,words,chars);
totchars += chars; chars = 0;
totwords += words; words = 0;
totlines += lines; lines = 0; } if( argc>1 )
printf("%8d%8d%8d total\n",totlines,totwords,totchars);
return 0; }

例子中具有三种匹配规则:

[a-zA-Z]+匹配1个或者多个字母组成的字符串

\n匹配换行

.匹配除了换行符以外的其他任意单一字符

可以看到规则1和规则3之间可能存在冗余,例如单个字符a,两个规则都可以匹配上,优先匹配规则1,故规则的顺序影响匹配的内容

例子4:词法分析解析算数表达式

%option noyywrap

%%
"+" { printf("PLUS\n"); }
"-" { printf("SUBS\n"); }
"*" { printf("MULT\n"); }
"/" { printf("DIVDE\n"); } [0-9]+ { printf("NUMBER %s\n",yytext); }
[ \t ] {}
\n { printf("NEWLINE\n"); } . { printf("Mystery character %s\n",yytext); } %%

测试例子:

[root@typhoeus79 flex]# ./test
5 6 / 7q
NUMBER 5
NUMBER 6
DIVDE
NUMBER 7
Mystery character q
NEWLINE
12+34
NUMBER 12
PLUS
NUMBER 34
NEWLINE