编译原理——词法分析代码下载

【文件属性】：

文件名称：编译原理——词法分析代码

文件大小：83KB

文件格式：GZ

更新时间：2014-06-17 07:12:30

编译原理词法分析 C++代码

⒈ 题目编写前述PASCAL子集的词法分析程序。１）主程序设计考虑，（参阅后面给出的程序框架）主程序的说明部分为各种表格和变量安排空间。数组k为关键字表，每个数组元素存放一个关键字。采用定长的方式，较短的关键字后面补空格。 P 数组存放分界符。为了简单起见，分界符、算术运算符和关系运算符都放在p表中（学生编程时，应建立算术运算符表和关系运算符表，并且各有类号），合并成一类。 id 和ci 数组分别存放标识符和常数。 instring 数组为输入源程序的单词缓存。 outtoken 记录为输出内部表示缓存。还有一些为造表填表设置的变量。主程序开始后，先以人工方式输入关键字，造 k 表；再输入分界符等造 p 表。主程序的工作部分设计成便于调试的循环结构。每个循环处理一个单词；接收键盘上送来的一个单词；调用词法分析过程；输出每个单词的内部码。２）词法分析过程考虑该过程取名为 lexical，它根据输入单词的第一个字符（有时还需读第二个字符），判断单词类，产生类号：以字符k表示关键字；i表示标识符；c 表示常数；p 表示分界符；s 表示运算符（学生编程时类号分别为1,2,3,4,5）。对于标识符和常数，需分别与标识符表和常数表中已登记的元素相比较，如表中已有该元素，则记录其在表中的位置，如未出现过，将标识符按顺序填入数组 id 中，将常数变为二进制形式存入数组中 ci 中，并记录其在表中的位置。 lexical 过程中嵌有两个小过程：一个名为 getchar，其功能为从 instring 中按顺序取出一个字符，并将其指针 pint 加 1 ；另一个名为 error，当出现错误时，调用这个过程，输出错误编号。将词法分析程序设计成独（入口）立一遍扫描源程序的结构。其流程图见图5-1。图5-1 词法分析程序流程图 ⒉ 要求 ⑴ 所有识别出的单词都用两个字节的等长表示，称为内部码。第一个字节为 t ，第二个字节为 i 。 t 为单词的种类。关键字的 t=１；分界符的 t=２；算术运算符的 t=３；关系运算符的 t=４；无符号数的 t=５；标识符的 t=６。i 为该单词在各自表中的指针或内部码值。表 5-1 为关键字表；表 5-2 为分界符表；表 5-3 为算术运算符的 i 值；表 5-4 为关系运算符的 i 值。表5-1 关键字表表5-2 分界符表指针1 关键字指针1 分界符 0 BEGIN 0 ， 1 DO 1 ； 2 ELSE 2 . 3 END 3 := 4 IF 4 ( 5 THEN 5 ) 6 VAR 7 WHILE 表5-3 算术运算符表5-4 关系运算符 i 值算术运算符 i 值关系运算符 00H < 10H + 01H <= 11H － 02H = 20H * 03H > 21H / 04H >= 05H <> 常数表和标识符表是在编译过程中建立起来的。其 i 值是根据它们在源程序中出现的顺序确定的。 ⑵ 常数分析程序、关键字和标识符分析程序、其他单词分析程序请参阅范例自行设计。 ⑶ 本实践题可通过扩充下面给出的程序框架完成。 PROGRAM plexical(input,output); LABEL l; CONST keylen=10; identlen=10; TYPE //定义的类型 tstring=ARRAY[1..identlen] OF char; outreco=RECORD//记录为输出内部表示缓存。 ty: char; point: integer; END; {outreco} VAR cip,ip,pint,i,j,l,m,errorx:integer; charl:CHAR; ci:ARRAY[1..10] OF integer; k,id:ARRAY[1..keylen] OF tstring; token:tstring; //标志符 outtoken:outreco; instring:ARRAY[1..10]OF char; p:ARRAY[1..16] OF ARRAY [1..2] OF char; PROCEDURE lexical; VAR l,m,num:integer; b: boolean; PROCEDURE getchar; BEGIN charl:=instring [pint] ; pint:=pint+1 END; {getchar} PROCEDURE error; BEGIN writeln('error',errorx) END;{error} BEGIN FOR 1:=1 TO identlen DO token[1]:=' '; getchar; WHILE char1=' ' DO getchar; IF char1 IN ['a'..'z'] THEN BEGIN /*处理标识符*/ m:=1; WHILE (char1 IN ['a'..'z']) OR (char1 IN ['0'..'9']) DO BEGIN IF m<=identlen THEN BEGIN token[m]:=char1; m:=m+1 END; getchar END;{while} pint:=pint-1; 1:=1; b:=false; WHILE (1<=keylen) AND (NOT b) DO BEGIN b:=true; i:=1; WHILE (i<=identlen) AND b DO IF k[1] [i]=token[i] //判断是否为关键字 THEN i:=i+1 ELSE b:=false; IF NOT b THEN l:=l+1 END IF 1<=keylen //关键字则记录下来 THEN BEGIN outtoken.ty:='k'; outtoken.point:=1 END ELSE BEGIN l:=1; b:=false; WHILE (l<=ip) AND (NOT b ) DO BEGIN b:=true; i:=1; WHILE (i<=identlen) AND b DO IF id[1][i]=token[i] THEN i:=i+1 ELSE b:=false; IF NOT b THEN l:=l+1; END; IF NOT b THEN l:=l+1; IF 1>ip THEN BEGIN ip:=ip+1; FOR m:=1 TO identlen DO id[ip][m]:=token[m]; outtoken.ty:='i'; outtoken.point:=1 END END END ELSE IF char1 IN ['0'..'9'] THEN BEGIN 处理常数 END{integer} ELSE IF char1 IN [',',';','.',':','(',')'] THEN BEGIN 处理分界符 END ELSE IF char IN ['+','-','*','/','.','<','=','>'] THEN BEGIN 处理运算符 END ELSE BEGIN errorx : =2; error END END; {lexica1} BEGIN writeln ('k-table, input!'); FOR 1:=1 TO keylenDO FOR m:=1 TO identlenDO read (k[1] [m] ); readln ; FOR l:=1 TO identlen DO id [1] [m]:=' '; writeln ('p-table, input!'); FOR l:=1 TO 11 DO FOR m:=1 TO 2 DO read(p[l] [m]); readln; ip:=0; cip:=1; pint:=1; l: writeln('source, input!'); FOR j:=1 TO identlen DO Read (instring[j] ); lexical; writeln (outtoken.ty); writeln (outtoken. point); FOR l:=1 TO identlen DO write (token[ 1 ]); writeln; GOTO 1 END.

立即下载

【文件预览】：
Lexical_Analysis
----init.txt(74B)
----.project(2KB)
----.cproject(59KB)
----Debug()
--------objects.mk(231B)
--------Lexical_Analysis(107KB)
--------makefile(1KB)
--------src()
--------sources.mk(528B)
----src()
--------Lexical_Analysis.cpp(5KB)

秒客网

编译原理——词法分析代码

网友评论

相关文章