编译原理课程实验
编译原理课程实验,词法分析与语法分析的实现
写在开头:
编译真的是一个很难的东西,课上完,题是会写了,代码是一点写不来,我这代码还是在先人的代码的基础上改编的,真是绷不住了。然后编译这个过程相对于我们用户来说也是很透明的,以至于不管你写了多少代码,你基本还是不知道它是怎么将你的代码转换成正确,简化过的汇编语言。但没有这玩意我们就用不了高级语言,所以还是要向研究编译过程的前人致以崇高的敬意。
声明:本人c++入门水平,佬们没必要浪费时间看这坨代码。
如果有任何违规的地方,请第一时间联系我,我会立即删除本文。
实验一:词法分析
1.输入输出格式
输入:PL/0源程序所在的文件。 输出:关键字、专用符号以及其它标记。
2.实现过程
本实验实现的PL/0的基本词法如下:
关键字: begin、call、const、do、end、if、odd、procedure、read、then、var、while、write;
专用符号: + , - , * , / , ( , ) , =(逻辑判断符号,等于) , , , .(程序结束标志) , #(不等于) , ; , := , <= , >=
其它标记:id num
分别给以上关键词,专用符号,其他标记标号,用以简化输出。
关键字对应1~13号,id对应100号,num对应200号,专用符号对应:‘+’(407),‘-’(408),‘*’(409),‘/’(410),‘(’(502),‘)’(503),‘=’(401),
‘,’(504),‘.’(0),'#'(406),';'(501),':='(511),'<='(404),'<'(405),'>='(402),'>'(403)
ID = letter (letter/digit)*
NUM = digit digit*
letter = a|b|...|z|A|B|...|Z|
ditit= 0|1|...|9
3.主体结构的说明
此处用来说明代码中的主要函数:1.Scan函数:这是对程序进行词法分析的主要函数,用来确定接下来的词是否为:关键词or数字常量or专用符号or什么都不是。2.main函数:将文件中的内容提取出来,对文件中的每个词进行词法分析,每分析完一个词就按照该词的种类进行输出。
4.实现原理
程序中先判断这个句语句中每个单元为关键字、常数、运算符、界符,对与不同的单词符号给出不同编码形式的编码,用以区分之。
5.实现过程
1.流程图:
2.核心代码:
文件内的PL0代码:
const m=7, n=85;
var x,y,z,q,r;
procedure multiply;
var a,b;
begin
a:=x; b:=y; z:=0;
while b>0 do
begin
if odd b then z:=z+a;
a:=2*a; b:=b/2;
end;
write(a,b);
end;
procedure divide;
var w;
begin
r:=x; q:=0; w:=y;
while w<=r do w:=2*w;
while w>y do
begin
q:=2*q; w:=w/2;
if w<=r then
begin
r:=r-w;
q:=q+1;
end;
end;
write(r,w);
end;
procedure gcd;
var f,g;
begin
f:=x;
g:=y;
while f#g do
begin
if f<g then g:=g-f;
if g<f then f:=f-g;
end;
write(f,g);
end;
begin
x:=m; y:=n; call multiply;
x:=25; y:=3; call divide;
read(x,y); call gcd;
end.
程序的源代码:
#include<iostream>
#include<string>
#include<fstream>
#include<sstream>
using namespace std;
int i,j,k,flag,number,status;
/*status用来判断字符串是否为关键词!*/
char ch;
string words = "";
string keywords[13] = {"begin","call","const","do","end","if","odd","procedure","read","then","var","while","write"};
string program;
int Scan(string program)
{
words = "";
number = 0; status = 0;
j = 0;ch = program[i++];
while(ch == ' ' or ch == '\n' or ch =='\r')/*跳过空格和换行符*/
{
ch = program[i++];
}
/*如果是字符串*/
if ((ch >= 'a') && (ch <= 'z' ))
{
while (((ch >= 'a') && (ch <= 'z'))||((ch >= '0') && (ch <= '9')))
{
words += ch;
ch=program[i++];
}
i--;
for (k = 0; k < 13; k++)
if (words.compare(keywords[k]) == 0)
switch(k)
{
case 0:{//begin
flag = 1;
status = 1;
break;
}
case 1:{//call
flag = 2;
status = 1;
break;
}
case 2:{//const
flag = 3;
status = 1;
break;
}
case 3:{//do
flag = 4;
status = 1;
break;
}
case 4:{//end
flag = 5;
status = 1;
break;
}
case 5:{//if
flag = 6;
status = 1;
break;
}
case 6:{//odd
flag = 7;
status = 1;
break;
}
case 7:{//procedure
flag = 8;
status = 1;
break;
}
case 8:{//read
flag = 9;
status = 1;
break;
}
case 9:{//then
flag = 10;
status = 1;
break;
}
case 10:{//var
flag = 11;
status = 1;
break;
}
case 11:{//while
flag = 12;
status = 1;
break;
}
case 12:{//write
flag = 13;
status = 1;
break;
}
}
if (status == 0)
{
flag = 100;
}
}
/*如果是数字*/
else if (ch >= '0' && ch <= '9')
{
number = 0;
while (ch >= '0' && ch <= '9' )
{
number = number*10+(ch-'0');
ch= program[i++];
}
flag = 200;
i--;
}
/*其他的一些特殊符号*/
else switch (ch)
{
case '=':{//相等
words+= ch;
flag = 401;
break;
}
case '>':{// >= or >
words += ch;
ch= program[i++];
if (ch == '=')
{
words += ch;
flag = 402;
}
else
{
i--;
flag = 403;
}
break;
}
case '<':{// <= or <
words += ch;
ch= program[i++];
if (ch == '=')
{
words += ch;
flag = 404;
}
else
{
i--;
flag = 405;
}
break;
}
case '#':{// #不等于
words += ch;
flag = 406;
break;
}
case '+':{// +
words += ch;
flag= 407;
break;
}
case '-':{// -
words += ch;
flag = 408;
break;
}
case '*':{// *
words += ch;
flag = 409;
break;
}
case '/':{// /
words += ch;
flag= 410;
break;
}
case ':':{// :=(赋值)
words += ch;
ch = program[i++];
if(ch == '=')
{
words += ch;
flag = 511;
}
else
{
flag = -1;
}
break;
}
case ';':{// ;
words += ch;
flag = 501;
break;
}
case '(':{// (
words += ch;
flag = 502;
break;
}
case ')':{// )
words += ch;
flag = 503;
break;
}
case ',':{// ,
words += ch;
flag = 504;
break;
}
case '.':{// .
words += ch;
flag = 0;
break;
}
default:{
flag = -1;
break;
}
}
return flag;
}
int main()
{
ifstream file("/Users/zpt/code/cpphomework/PL0语句.txt");
if(!file.is_open())
{
cerr<<"无法打开文件"<<endl;
return -1;
}
stringstream buffer;
buffer <<file.rdbuf();
program = buffer.str();
file.close();
i = 0;
do{
flag = Scan(program);
if (flag == 200)
{
cout<<flag<<" , "<<number<<endl;;
}
else if (flag == -1)
{
cout<<flag<<" , error words:"<<words<<endl;
}
else
{
cout<<flag<<" , "<<words<<endl;
}
}while (flag != 0);
return 0;
}
6.有待提升的地方
关键词实际上是按照字典序排的,可以用折半查找来提高查找效率。
实验二:语法分析
1.输入输出格式
输入:PL/0源程序所在的文件。 输出:将错误信息输出到语法错误文件中,输出语法树。
2.实现过程
对于已给PL/0语言文法,利用递归子程序法,编制语法分析程序。
3.主体结构的说明
主要函数有:
1.void error(int n);根据n的不同,输出不同的错误信息。
2.int getsym();读取一个词
3.int getch();读取一个字符
4.void init();对一些要用到的数组进行初始化,如:ssym存储专用字符;word存储关键字以方便匹配;wsym存储关键词的枚举类型,用来表示关键词的类型等;
5.void enter(enum object k,int* ptx,int lev,int*pdx);用于保存相应词的信息,如若该单词为数字,则保存其值;若为变量名,则保存改变量所在的层数及其地址;若为存储过程,则保存改存储过程所在的层数。
6.int constdeclaration(int* ptx,int lev,int *pdx);对于常量定义部分的处理函数
7.int vardeclaration(int *ptx,int lev,int* pdx);对于变量声明部分的处理函数
8.int position(char* idt,int tx);查找变量名
9.int inset(int e,bool* s);返回对应的e号的终结符是否属于此部分的First集合
10.int addset(bool* sr,bool* s1,bool* s2,int n);将两个First集合求并集
11.int subset(bool* sr,bool* s1,bool* s2,int n);将两个First集合求差
12.int mulset(bool * sr,bool* s1,bool* s2,int n);将两个First集合求交集
13.int test(bool* s1,bool*s2,int n);测试下一个词是否属于First集合,若不属于,则报错,并一直查找下一个词直到下一个词属于First集合。
14.int factor(bool* fsys,int* ptx,int lev);因子(一个具体的非终结符)的处理
15.int term(bool* fsys,int* ptx,int lev);项(一个具体的非终结符)的处理
16.int expression_r(bool* fsys,int *ptx,int lev);表达式(一个具体的非终结符)的处理
17.int condition(bool* fsys,int* ptx,int lev);条件语句的处理
18.int statement(bool* fsys,int* ptx,int lev);对于以每种关键词开头的语句的处理
19.int block(int lev,int tx,bool* fsys);分程序(一个具体的非终结符)的处理
4.实现原理
PL/0语法如下:
<程序>::=<分程序>.
<分程序>::=[<常量说明部分>;][<变量说明部分>;]{<过程说明部分>;}<语句部分>
<常量说明部分>::=const<常量定义>{,<常量定义>}
<常量定义>::=<标识符>=<无符号整数>
<无符号整数>::=<数字>{<数字>}
<数字>::=0|1|2|3|4|5|6|7|8|9
<变量说明部分>::=var<标识符>{<标识符>}
<标识符>::=<字母>{<字母>|<数字>}
<过程说明部分>::=<过程首部><分程序>
<过程首部>::=procedure<标识符>
<语句部分>::=<语句>|<复合语句>
<复合语句>::=begin<语句>{;<语句>}end
<语句>::=<赋值语句>|<条件语句>|<当型循环语句>|<过程调用语句>|<读语句>|<写语句>|<复合语句>|<空语句>
<赋值语句>::=<标识符>:=<表达式>
<条件语句>::=<表达式><关系运算符><表达式>|odd<表达式>
<表达式>::=[+|-]<项>|<表达式><加法运算符><项>
<项>::=<因子>|<项><乘法运算符><因子>
<因子>::=<标识符>|<常量>|(<表达式>)
<常量>::=<无符号整数>
<加法运算符>::=+|-
<乘法运算符>::=*|/
<关系运算符>::=<|>|<>|>=|<=|=
<条条件语句>::=if<条件>then<语句>
<过程调用语句>::=call<标识符>
<当型循环语句>::=while<条件>do<语句>
<空语句>::=
<读语句>::=read(<标识符>{,<标识符>})
<写语句>::=write(<表达式>{,<表达式>})
<字母>::=a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z
5.实现过程
1.流程图:
非终结符太多了,自顶下降分析的可能性就更多了,而且还有层的嵌套,所以摆了。
2.核心代码:
文件内的PL0代码:
const m=7, n=85;
var x,y,z,q,r;
procedure ; (这行少了标识符)
var a,b;
begin
a:=x; b:=y; z:=0;
while b>0 do
begin
if odd b then z:=z+a;
a:=2*a; b:=b/2;
end;
write(a,b);
end;
procedure divide;
var w;
begin
r:=x; q:=0; w:=y;
while w<=r do w:=2*w;
while w>y do
begin
q:=2*q; w:=w/2;
if w<=r then
begin
r:=r-w;
q:=q+1;
end;
end;
write(r,w);
end;
procedure gcd;
var f,g;
begin
f:=x;
g:=y;
while f#g do
begin
if f<g then g:=g-f;
if g<f then f:=f-g;
end;
write(f,g);
end;
begin
x:=m; y:=n; call multiply; (因为之前的过程定义少了标识符,所以这个表示符未定义)
x:=25; y:=3; call divide;
read(x,y); call gcd;
. (这行少了end)
程序的源代码:
LP0头文件:
#ifndef LP0_h
#define LP0_h
#define norw 13//关键字的个数
#define txmax 100//名字表的容量
#define nmax 14//数字的最大位数
#define al 10//符号的最大长度
#define amax 2047//地址上界
#define levmax 3//最大允许的嵌套声明层数
#define cxmax 200//最多的虚拟机代码数
#define one_line_max_character_num 105//一行的字符个数的上线,用于限制line(缓冲区数组)的大小
enum symbol{
//枚举类型:
//nul=0,ident=1,number=2,plus=3,minus=4
//times=5,依次类推,procsym=31
nul, ident, number,
//下面的表示的是系统的算数运算符以及逻辑运算符,知道意思就可以
plus, minus, times,//+,-,*
slash, oddsym, eql, neq,// /,判断是否为奇数,=,#
lss, leq, gtr, geq, lparen,// <,<=,>,>=,(
rparen, comma, semicolon, period, becomes,//) , , , ; , . , :=
//下面的表示是系统的保留字
beginsym, endsym, ifsym, thensym, whilesym,
writesym, readsym, dosym, callsym, constsym,
varsym, procsym,
};
#define symnum 32
enum object{
constant,
variable,
procedur,
};
enum fct{
lit, opr, lod,
sto, cal, inte,
jmp, jpc,
};//不用
#define fctnum 8//不用
struct instruction
{
enum fct f;//虚拟机代码指令
int l;//引用层与声明层的层差
int a;//根据f的不同而不同,参考课本
};//不用
FILE* fas;//输出名字表
FILE* fa;//输出虚拟机代码
FILE* fa1;//输出源文件及其各行对应的首地址
FILE* fa2;//输出结果
bool listswitch;
bool tableswitch;
char ch;//获取字符的缓冲区
int tx = 0;//当前符号表的下标
enum symbol sym;
char id[al+1];
int num;
int cc,ll;//cc表示当前字符的位置
int cx;//虚拟机代码指针
char line[81];//读取行缓冲区
char a[al+1];//临时符号,多出的一个字节用于表示字符串的结尾
struct instruction code [cxmax];//存放虚拟机代码的数组
char word[norw][al];//保留字
enum symbol wsym[norw];//保留字对应的符号值
enum symbol ssym[256];//单符号的符号值
char mnemonic [fctnum][5];//虚拟机代码指令的名称
bool declbegsys[symnum];//表示声明开始的符号集合
bool statbegsys[symnum];//表示语句开始的符号集合
bool facbegsys[symnum];//表示因子开始的符号集合
//名字表结构
struct tablestruct
{
char name[al];//名字
enum object kind;//类型:const,var,array,procedure
int val;//数值,仅const使用
int level;//所处层
int adr;//地址
int size;//需分配的数据空间
};
struct tablestruct table[txmax];//名字表
FILE* fin;
FILE* fout;
char fname[al];
int err;//错误计数器,没出一次错误,其加一
#define getsymdo if(-1==getsym())return -1
#define getchdo if(-1==getch())return -1
#define testdo(a,b,c) if(-1==test(a,b,c))return -1
#define gendo(a,b,c) if(-1==gen(a,b,c))return -1
#define expressiondo(a,b,c) if(-1==expression_r(a,b,c))return -1
#define factordo(a,b,c) if(-1==factor(a,b,c))return -1
#define termdo(a,b,c) if(-1==term(a,b,c))return -1
#define conditiondo(a,b,c) if(-1==condition(a,b,c))return -1
#define statementdo(a,b,c) if(-1==statement(a,b,c))return -1
#define constdeclarationdo(a,b,c) if(-1==constdeclaration(a,b,c))return -1
#define vardeclarationdo(a,b,c) if(-1==vardeclaration(a,b,c))return -1
void error(int n);
int getsym();
int getch();
void init();
int gen(enum fct x,int y,int z);
int test(bool*s1,bool*s2,int n);
int inset(int e,bool*s);
int addset(bool*sr,bool*s1,bool*s2,int n);
int subset(bool*sr,bool*s1,bool*s2,int n);
int mulset(bool*sr,bool*s1,bool*s2,int n);
int block(int lev,int tx,bool* fsys);
void interpret();
int factor(bool* fsys,int* ptx,int lev);
int term(bool*fsys,int*ptx,int lev);
int condition(bool*fsys,int*ptx,int lev);
int expression_r(bool*fsys,int*ptx,int lev);
int statement(bool*fsys,int*ptx,int lev);
void listcode(int cx0);
int vardeclaration(int* ptx,int lev, int* pdx);
int constdeclaration(int* ptx,int lev, int* pdx);
int position(char* idt,int tx);
void enter(enum object k,int* ptx,int lev,int* pdx);
int base(int l,int* s,int b);
#endif /* LP0_h */
main函数:
#include <iostream>
#include "LP0.h"
#include <string>
#include<fstream>
#include<sstream>
std::ofstream outfile("/Users/zpt/code/cpphomework/语法分析结果.txt");
std::ifstream infile("/Users/zpt/code/cpphomework/PL0语句.txt");
int main()
{
if(!outfile.is_open())
{
std::cerr <<"打开输出文件失败"<<std::endl;
return -1;
}
if(!infile.is_open())
{
std::cerr <<"打开输入文件失败"<<std::endl;
return -1;
}
bool nxtlev[symnum];
init();
err = 0;
cc=cx=ll=0;
ch=' ';
if(-1 != getsym())
{
addset(nxtlev, declbegsys, statbegsys, symnum);
nxtlev[period] = true;
if(-1 == block(0, 0, nxtlev))
{
outfile<<std::endl;
return 0;
}
if(sym != period)
{
error(9);
}
if(err == 0)
{
outfile<<"编译成功"<<std::endl;
}
else
{
outfile<<"Errors in pl/0 program"<<std::endl;
}
}
outfile<<std::endl;
infile.close();
outfile.close();
return 0;
}
void error(int n)
{
char space[100];
memset(space, 32, 100);
space[cc-1] = 0;
switch(n)
{
case 1:
{
strcpy(space,"Error 01: 常数说明中“=”写成“:=”");
break;
}
case 2:
{
strcpy(space,"Error 02: 常数说明中的“=”后应为数字");
break;
}
case 3:
{
strcpy(space,"Error 03: 常数说明中的标识符后应是“=”");
break;
}
case 4:
{
strcpy(space,"Error 04: const,var,procedure后应为标识符");
break;
}
case 5:
{
strcpy(space,"Error 05: 漏掉了‘,’或‘;’");
break;
}
case 6:
{
strcpy(space,"Error 06: 过程说明后的符号不正确(应是语句开始符或过程开始符)");
break;
}
case 7:
{
strcpy(space,"Error 07: 应是语句开始符");
break;
}
case 8:
{
strcpy(space,"Error 08: 过程体内语句部分的后跟符不正确");
break;
}
case 9:
{
strcpy(space,"Error 09: 程序结尾丢了句号‘.’");
break;
}
case 10:
{
strcpy(space,"Error 10: 语句之间漏了‘;’");
break;
}
case 11:
{
strcpy(space,"Error 11: 标识符未定义");
break;
}
case 12:
{
strcpy(space,"Error 12: 赋值语句中,赋值号左部标识符属性应是标识符");
break;
}
case 13:
{
strcpy(space,"Error 13: 赋值语句左部标识符应是赋值号‘:=’");
break;
}
case 14:
{
strcpy(space,"Error 14: call后应为标识符");
break;
}
case 15:
{
strcpy(space,"Error 15: call后标识符属性应为过程");
break;
}
case 16:
{
strcpy(space,"Error 16: 条件语句中丢了then");
break;
}
case 17:
{
strcpy(space,"Error 17: 丢了end或;");
break;
}
case 18:
{
strcpy(space,"Error 18: while型循环语句中丢了do");
break;
}
case 19:
{
strcpy(space,"Error 19: 语句后的标识符不正确");
break;
}
case 20:
{
strcpy(space,"Error 20: 应为关系运算符");
break;
}
case 21:
{
strcpy(space,"Error 21: 表达式内标识符属性不能是过程");
break;
}
case 22:
{
strcpy(space,"Error 22: 表达式中漏掉了右括号‘)’");
break;
}
case 23:
{
strcpy(space,"Error 23: 因子后的非法符号");
break;
}
case 24:
{
strcpy(space,"Error 24: 表达式开始符不能是此符号");
break;
}
case 25:
{
strcpy(space,"Error 25: 文件在不该结束的地方结束了");
break;
}
case 26:
{
strcpy(space,"Error 26: 结束符出现在不该结束的地方");
break;
}
case 27:
{
strcpy(space,"Error 27: 过程嵌套层数太多");
break;
}
case 28:
{
strcpy(space,"Error 28: repeat语句中缺少until");
break;
}
case 29:
{
strcpy(space,"Error 29: write语句中漏掉了右括号‘)’");
break;
}
case 30:
{
strcpy(space,"Error 30: 数组缺少右括号‘]’");
break;
}
case 31:
{
strcpy(space,"Error 31: 数越界");
break;
}
case 32:
{
strcpy(space,"Error 32: read语句括号中标识符不是变量");
break;
}
case 33:
{
strcpy(space,"Error 33: read语句中漏掉了左括号‘(’");
break;
}
case 34:
{
strcpy(space,"Error 34: read语句中漏掉了右括号‘)’");
break;
}
case 35:
{
strcpy(space,"Error 35: 数组维数应为数字");
break;
}
case 36:
{
strcpy(space,"Error 36: 数组缺少左括号‘[’");
break;
}
case 37:
{
strcpy(space,"Error 37: 数组越界");
break;
}
case 38:
{
strcpy(space,"Error 38: 变量名称过长");
break;
}
}
outfile<<"****"<<space<<std::endl;
err++;
}
void init()
{
int i;
for(i=0;i<=255;i++)
{
ssym[i] = nul;
}
ssym['+'] = plus;
ssym['-'] = minus;
ssym['*'] = times;
ssym['/'] = slash;
ssym['('] = lparen;
ssym[')'] = rparen;
ssym['='] = eql;
ssym[','] = comma;
ssym['.'] = period;
ssym['#'] = neq;
ssym[';'] = semicolon;
strcpy(&(word[0][0]), "begin");
strcpy(&(word[1][0]), "call");
strcpy(&(word[2][0]), "const");
strcpy(&(word[3][0]), "do");
strcpy(&(word[4][0]), "end");
strcpy(&(word[5][0]), "if");
strcpy(&(word[6][0]), "odd");
strcpy(&(word[7][0]), "procedure");
strcpy(&(word[8][0]), "read");
strcpy(&(word[9][0]), "then");
strcpy(&(word[10][0]), "var");
strcpy(&(word[11][0]), "while");
strcpy(&(word[12][0]), "write");
wsym[0] = beginsym;
wsym[1] = callsym;
wsym[2] = constsym;
wsym[3] = dosym;
wsym[4] = endsym;
wsym[5] = ifsym;
wsym[6] = oddsym;
wsym[7] = procsym;
wsym[8] = readsym;
wsym[9] = thensym;
wsym[10] = varsym;
wsym[11] = whilesym;
wsym[12] = writesym;
for(i=0;i<symnum;i++)
{
declbegsys[i]=false;
statbegsys[i]=false;
facbegsys[i]=false;
}
declbegsys[constsym]=true;
declbegsys[varsym]=true;
declbegsys[procsym]=true;
statbegsys[beginsym]=true;
statbegsys[callsym]=true;
statbegsys[ifsym]=true;
statbegsys[whilesym]=true;
facbegsys[ident]=true;
facbegsys[number]=true;
facbegsys[lparen]=true;
}
int getch()
{
if(cc == ll)
{
ll=0;
cc=0;
outfile<<cx;
ch=' ';
while(ch!=10)
{
infile.get(ch);
if(infile.eof())
{
line[ll] = 0;
break;
}
outfile<<ch;
line[ll] = ch;
ll++;
}
outfile<<std::endl;
}
ch = line[cc];
cc++;
return 0;
}
int getsym()
{
int i,j,k;
while(ch==' '||ch==10||ch==9)
{
getchdo;
}
//是单词吗?
if(ch>='a'&&ch<='z')// *******有点不一样
{
k=0;
do
{
if(k<al)//没超过这个长度都读入
{
a[k] = ch;
}
k++;
getchdo;
}while((ch>='a'&&ch<='z')||(ch>='0'&&ch<='9'));
if(k>al)//超过这个长度了,报错
{
error(38);
k = al;
}
a[k] = 0;
strcpy(id, a);
i = 0;
j = norw-1;
do
{
k = (i+j)/2;
if(strcmp(id, word[k])<=0)
j = k-1;
if(strcmp(id, word[k])>=0)
i = k+1;
}while(i<=j);
if(i-1>j)
sym = wsym[k];
else
sym = ident;
}
else
{
//是数字吗?
if(ch>='0'&&ch<='9')
{
k = 0;
num = 0;
sym = number;
do
{
num=10*num+ch-'0';
k++;
getchdo;
}while(ch>='0'&&ch<='9');
k--;
if(k+1>nmax)
{
error(30);
}
}
else
{
//是赋值吗?
if(ch==':')
{
getchdo;
if(ch=='=')
{
sym = becomes;
getchdo;
}
else
{
sym = nul;
}
}
else
{
//是小于系列吗?
if(ch=='<')
{
getchdo;
if(ch=='=')
{
sym = leq;
getchdo;
}
else
sym = lss;
}
else
{
//是大于系列吗?
if(ch=='>')
{
getchdo;
if(ch=='=')
{
sym = geq;
getchdo;
}
else
sym = gtr;
}
else
{
sym = ssym[ch];
if(sym!=period)
getchdo;
}
}
}
}
}
return 0;
}
void enter(enum object k,int* ptx,int lev,int*pdx)
{
(*ptx)++;
strcpy(table[*ptx].name,id);
table[(*ptx)].kind = k;
switch(k)
{
case constant:
{
if(num>amax)
{
error(31);
num = 0;
}
table[*ptx].val = num;
break;
}
case variable:
{
table[*ptx].level = lev;
table[*ptx].adr = *pdx;
(*pdx)++;
break;
}
case procedur:
{
table[*ptx].level = lev;
break;
}
}
}
int constdeclaration(int* ptx,int lev,int *pdx)
{
if(sym == ident)
{
getsymdo;
if(sym == eql||sym == becomes)
{
if(sym == becomes)//const中,=写成了:=
error(1);
getsymdo;
if(sym == number)
{
enter(constant, ptx, lev, pdx);
getsymdo;
}
else
error(2);
}
else
error(3);
}
else
error(4);
return 0;
}
int vardeclaration(int *ptx,int lev,int* pdx)
{
if(sym == ident)
{
enter(variable, ptx, lev, pdx);
getsymdo;
}
else
{
error(4);
}
return 0;
}
int position(char* idt,int tx)
{
int i;
strcpy(table[0].name,idt);
i = tx;
while(strcmp(table[i].name, idt) != 0)
i--;
return i;
}
int inset(int e,bool* s)
{
return s[e];
}
int addset(bool* sr,bool* s1,bool* s2,int n)//集合取并集
{
int i;
for(i = 0;i<n;i++)
{
sr[i] = s1[i]||s2[i];
}
return 0;
}
int subset(bool* sr,bool* s1,bool* s2,int n)//集合减法
{
int i;
for(i=0;i<n;i++)
{
sr[i]=s1[i]&&(! s2[i]);
}
return 0;
}
int mulset(bool * sr,bool* s1,bool* s2,int n)//集合取交集
{
int i;
for(i=0;i<n;i++)
{
sr[i]=s1[i]&&s2[i];
}
return 0;
}
int test(bool* s1,bool*s2,int n)
{
if(!inset(sym, s1))
{
error(n);
while((!inset(sym, s1))&&(!inset(sym, s2)))
{
getsymdo;
}
}
return 0;
}
int factor(bool* fsys,int* ptx,int lev)
{
int i;
bool nxtlev[symnum];
testdo(facbegsys, fsys, 24);
while(inset(sym, facbegsys))
{
if(sym == ident)
{
i = position(id,*ptx);
if(i == 0)
{
error(11);
}
else
{
switch(table[i].kind)
{
case constant:
{
//产生四元式
break;
}
case variable:
{
//产生四元式
break;
}
case procedur:
{
error(21);
break;
}
}
}
getsymdo;
}
else
{
if(sym == number)
{
if(num>amax)
{
error(31);
num = 0;
}
//产生四元式
getsymdo;
}
else
{
if(sym == lparen)
{
getsymdo;
memcpy(nxtlev, fsys, sizeof(bool)*symnum);
nxtlev[rparen] = true;
expressiondo(nxtlev, ptx, lev);
if(sym == rparen)
{
getsymdo;
}
else
{
error(22);
}
}
test(fsys, facbegsys, 23);
}
}
}
return 0;
}
int term(bool* fsys,int* ptx,int lev)
{
enum symbol mulop;
bool nxtlev[symnum];
memcpy(nxtlev, fsys, sizeof(bool)*symnum);
nxtlev[times] = true;
nxtlev[slash] = true;
factordo(nxtlev, ptx, lev);
while(sym == times||sym == slash)
{
mulop = sym;
getsymdo;
factor(nxtlev, ptx, lev);
if(mulop == times)
{
//产生乘法四元式
}
else
{
//产生除法四元式
}
}
return 0;
}
int expression_r(bool* fsys,int *ptx,int lev)
{
enum symbol addop;
bool nxtlev[symnum];
if(sym == plus||sym == minus)
{
addop = sym;
getsymdo;
memcpy(nxtlev, fsys, sizeof(bool)*symnum);
nxtlev[plus] = true;
nxtlev[minus] = true;
termdo(nxtlev, ptx, lev);
if(addop == minus)
{
//产生四元式
}
}
else
{
memcpy(nxtlev, fsys, sizeof(bool)*symnum);
nxtlev[plus] = true;
nxtlev[minus] = true;
termdo(nxtlev, ptx, lev);
}
while(sym == plus||sym == minus)
{
addop = sym;
getsymdo;
memcpy(nxtlev, fsys, sizeof(bool)*symnum);
nxtlev[plus] = true;
nxtlev[minus] = true;
termdo(nxtlev,ptx,lev);
if(addop == plus)
{
//产生四元式
}
else
{
//产生四元式
}
}
return 0;
}
int condition(bool* fsys,int* ptx,int lev)
{
enum symbol relop;
bool nxtlev[symnum];
if(sym == oddsym)
{
getsymdo;
expressiondo(fsys, ptx, lev);
//创建四元式
}
else
{
memcpy(nxtlev, fsys, sizeof(bool)*symnum);
nxtlev[eql] = true;
nxtlev[neq] = true;
nxtlev[lss] = true;
nxtlev[leq] = true;
nxtlev[gtr] = true;
nxtlev[geq] = true;
expressiondo(nxtlev, ptx, lev);
if(sym != eql&&sym !=neq&&sym != lss&&sym != leq&&sym != gtr&&sym !=geq)
{
error(20);
}
else
{
relop = sym;
getsymdo;
expressiondo(fsys, ptx, lev);
switch(relop)
{
case eql:
{
//产生四元式
break;
}
case neq:
{
//产生四元式
break;
}
case lss:
{
//产生四元式
break;
}
case geq:
{
//产生四元式
break;
}
case gtr:
{
//产生四元式
break;
}
case leq:
{
//产生四元式
break;
}
default:
{
//无事发生
break;
}
}
}
}
return 0;
}
int statement(bool* fsys,int* ptx,int lev)
{
int i,cx1,cx2;
bool nxtlev[symnum];
if(sym == ident)
{
i = position(id, *ptx);
if(i == 0)
{
error(11);
}
else
{
if(table[i].kind != variable)
{
error(12);
i = 0;
}
else
{
getsymdo;
if(sym == becomes)
{
getsymdo;
}
else
{
error(13);
}
memcpy(nxtlev, fsys, sizeof(bool)*symnum);
expressiondo(nxtlev, ptx, lev);
if(i != 0)
{
//产生四元式
}
}
}
}
else
{
if(sym == readsym)
{
getsymdo;
if(sym != lparen)
{
error(33);//read无左括号为33
}
else
{
do
{
getsymdo;
if(sym == ident)
{
i = position(id, *ptx);
}
else
{
i = 0;
}
if(i == 0)
{
error(11);
}
else
{
//产生四元式
}
getsymdo;
}while(sym == comma);
}
if(sym != rparen)
{
error(34);
while(!inset(sym, fsys))
{
getsymdo;
}
}
else
{
getsymdo;
}
}
else
{
if(sym == writesym)
{
getsymdo;
if(sym != lparen)
{
error(39);//write无左括号
}
else
{
do
{
getsymdo;
memcpy(nxtlev, fsys, sizeof(bool)*symnum);
nxtlev[rparen] = true;
nxtlev[comma] = true;
expressiondo(nxtlev, ptx, lev);
//产生四元式
}while(sym == comma);
if(sym != rparen)
{
error(29);
}
else
{
getsymdo;
}
}
}
else
{
if(sym == callsym)
{
getsymdo;
if(sym != ident)
{
error(14);
}
else
{
i = position(id, *ptx);
if(i == 0)
{
error(11);
}
else
{
if(table[i].kind == procedur)
{
//创建四元式
}
else
{
error(15);
}
}
getsymdo;
}
}
else
{
if(sym == ifsym)
{
getsymdo;
memcpy(nxtlev, fsys, sizeof(bool)*symnum);
nxtlev[thensym] = true;
nxtlev[dosym] = true;
conditiondo(nxtlev, ptx, lev);
if(sym == thensym)
{
getsymdo;
}
else
{
error(16);
}
cx1 = cx;
//产生四元式
statement(fsys, ptx, lev);
}
else
{
if(sym == beginsym)
{
getsymdo;
memcpy(nxtlev, fsys, sizeof(bool)*symnum);
nxtlev[semicolon] = true;
nxtlev[endsym] = true;
statement(nxtlev, ptx, lev);
while(inset(sym, statbegsys)||sym == semicolon)
{
if(sym == semicolon)
{
getsymdo;
}
else
{
error(10);
}
statement(nxtlev, ptx, lev);
}
if(sym == endsym)
{
getsymdo;
}
else
{
error(17);
}
}
else
{
if(sym == whilesym)
{
cx1 = cx;
getsymdo;
memcpy(nxtlev, fsys, sizeof(bool)*symnum);
nxtlev[dosym] = true;
condition(nxtlev, ptx, lev);
cx2 = cx;
if(sym == dosym)
{
getsymdo;
}
else
{
error(18);
}
statement(fsys, ptx, lev);
//产生四元式
}
else
{
memset(nxtlev, 0, sizeof(bool)*symnum);
testdo(fsys, nxtlev, 19);
}
}
}
}
}
}
}
return 0;
}
int block(int lev,int tx,bool* fsys)
{
int i,dx,tx0,cx0;
bool nxtlev[symnum];
dx = 3;
tx0 = tx;
table[tx].adr = cx;
//产生四元式
if(lev>levmax)
error(27);
do
{
if(sym == constsym)
{
getsymdo;
do
{
constdeclarationdo(&tx, lev, &dx);
while(sym == comma)
{
getsymdo;
constdeclarationdo(&tx, lev, &dx);
}
if(sym == semicolon)
{
getsymdo;
}
else
{
error(5);
}
}while(sym == ident);
}
if(sym == varsym)
{
getsymdo;
do
{
vardeclarationdo(&tx, lev, &dx);
while(sym == comma)
{
getsymdo;
vardeclarationdo(&tx, lev, &dx);
}
if(sym == semicolon)
{
getsymdo;
}
else
{
error(5);
}
}while(sym == ident);
}
while(sym == procsym)
{
getsymdo;
if(sym == ident)
{
enter(procedur, &tx, lev, &dx);
getsymdo;
}
else
{
error(4);
}
if(sym == semicolon)
{
getsymdo;
}
else
{
error(5);
}
memcpy(nxtlev, fsys, sizeof(bool)*symnum);
nxtlev[semicolon] = true;
if(block(lev+1, tx, nxtlev) == -1)
{
return -1;
}
if(sym == semicolon)
{
getsymdo;
memcpy(nxtlev, statbegsys, sizeof(bool)*symnum);
nxtlev[ident] = true;
nxtlev[procsym] = true;
testdo(nxtlev, fsys, 6);
}
else
{
error(5);
}
}
memcpy(nxtlev, statbegsys, sizeof(bool)*symnum);
nxtlev[ident] = true;
nxtlev[period] = true;
test(nxtlev, declbegsys, 7);
}while(inset(sym, declbegsys));
table[tx0].adr = cx;
table[tx0].size = dx;
cx0 = cx;
//产生四元式
if(tx0+1>tx)
{
outfile<<"NULL"<<std::endl;
}
for(i = tx0+1;i<=tx;i++)
{
switch(table[i].kind)
{
case constant:
{
outfile<<i<<" const "<<table[i].name<<":";
outfile<<"val="<<table[i].val<<std::endl;
break;
}
case variable:
{
outfile<<i<<" var "<<table[i].name<<":";
outfile<<"lev="<<table[i].level<<" addr="<<table[i].adr<<std::endl;
break;
}
case procedur:
{
outfile<<i<<" proc "<<table[i].name<<":";
outfile<<"lev="<<table[i].level<<" addr="<<table[i].adr<<" size="<<table[i].size<<std::endl;
break;
}
}
outfile<<std::endl;
}
memcpy(nxtlev, fsys, sizeof(bool)*symnum);
nxtlev[semicolon] = true;
nxtlev[endsym] = true;
statementdo(nxtlev, &tx, lev);
//产生四元式
memset(nxtlev, 0, sizeof(bool)*symnum);
testdo(fsys, nxtlev, 8);
//列举代码
return 0;
}
6.有待提升的地方
语法分析的语法树没有实现(有一说一,这种图形不用特殊的库是输出不出来的吧)
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)