《Lex&Yacc C语言的lex和yacc工具说明.docx》由会员分享,可在线阅读,更多相关《Lex&Yacc C语言的lex和yacc工具说明.docx(18页珍藏版)》请在优知文库上搜索。
1、C语言的IeX和yacc工具说明作者:佚名文章来源:不详点击数:更新时间:2005-1-301.eX工具1.ex工具是一种词法分析程序生成器,它可以根据词法规则说明书的要求来生成单词识别程序,由该程序识别出输入文本中的各个单词。1、IeX程序的结构-定义部分-规则部分-用户子程序部分其中规则部分是必须的,定义和用户子程序部分是任选的。(1)定义部分定义部分起始于符号,终止于%符号,其间可以是包括include语句、声明语句在内的C语句。%(#includestdio.hincludey.tab.hexternintIineno;%(2)规则部分规则部分起始于%符号,终止于%符号,其间则是词法规
2、则。词法规则由模式和动作两部分组成。模式部分可以由任意的正则表达式组成,动作部分是由C语言语句组成,这些语句用来对所匹配的模式进行相应处理。需要注意的是,IeX将识别出来的单词存放在yytext字符数据中,因此该数组的内容就代表了所识别出来的单词的内容。%t;0-9+.?!0-9*.0-9+sscanf(yytext,zz%lf,z,&yylva1.val);returnNUMBER;nIineno+;return,n,;.returnyytex+O;%(3)用户子程序部分用户子程序部分可以包含用C语言编写的子程序,而这些子程序可以用在前面的动作中,这样就可以达到简化编程的目的。下面是带有用户
3、子程序的IeX程序片段。/*skipcmnts();.*restofrules*/%skipcmnts()(for(;)while(inputO!=,);if(input()!=,)unput(yytextyylen-1);elsereturn;)2、IeX工具的使用方法首先编写一个IeX程序vilex.1%(includestdio.h%)%n;0-9+printfCzInterger:%snzz,yytext);0-9*.0-9+printf(z,Float:%snzz,yytext);a-zA-Za-zA-Z0-9*printfCzWord:%snzr,yytext);.printf(z
4、,0thersymbol:%cnz,,yytext0);%然后使用IeX将lex.l转换成C语言程序$lexlex.1使用上述命令产生的C语言程序为lex.yy.C然后使用C编译程序将lex.yy.C编译成可执行程序regn$cc-clex.yy.c$cclex.yy.o-11-oregn下面可以使用regn来识别单词$Vitestfilex=355y=113p=y#./regntestfileWord:xOthersymbol:=Interger:355Word:yOthersymbol:=Interger:113Word:pOthersymbol:=Word:xOthersymbol:/W
5、ord:y#yacc工具yacc工具是一种语法分析程序生成器,它可以将有关某种语言的语法说明书转换成相应的语法分析程序,由该程序完成对相应语言中语句的语法分析工作。1、yacc程序结构在使用yacc工具前,必须首先编写yacc程序,因为有关语法分析程序是根据yacc程序生成的。yacc程序实际上是有关语法规则的说明书,它也是由定义部分、规则部分和子程序部分组成的。yacc程序的定义部分类似于IeX程序的定义部分,只是在其后可带有yacc声明,其中包括词法单词、语法变量、优先级和结合性信息。yacc程序的规则部分由语法规则和相应的动作组成,子程序部分可以包括在前面规则部分用到的子程序定义。接下来
6、是main主程序,它调用yyparse子程序来对输入进行语法分析,而yyparse反复地调用yylex子程序来获得输入单词,在语法出错时可通过yyerror子程序来处理。2、yacc工具的使用方法实例:我们将yacc程序分成片段,把这些片段组合在一起就是yacc程序。我们要使用的语法规则是一个有关四则运算的语法规则,可用BNF范式描述list:exprnlistexprnexpr:NUMBERexpr+exprexpr-exprexpr*exprexpr/expr(expr)其含义是IiSt是一个表达式序列,每个后面带有一个新行。表达式是一个数值,或是由运算符连起来的两个表达式,以及用圆括号括
7、起来的表达式。下面是有关上述语法规则的yacc程序片段。$Vihoc.y%defineYYSTYPEdouble%)%tokenNUMBER%left,-%left*%list:Ilistn,Ilistexpr,n,printf(,zt%.8gn,$2);fexpr:NUMBER$=$1;Iexpr,+,expr$-$1+$3;iexpr-expr$=$1-$3;expr*expr$二$1*$3;exprexpr$=$1/$3;,(,expr,),$=$2;%上述yacc程序片段实际上是它的定义部分和规则部分。在yacc声明部分,%tokenMJMBER表明了NUMBER是一个单词符号,lef
8、t则表明了运算符号的左结合性,并且和/和优先级比+和的优先级高。在yacc程序的规则部分,备用规则是用1隔开的,规则中的动作实际上是C语句序列,其中$n(即$1,$2等)是用来引用规则中的第几个成份,而$则代表了整个规则的返回值。下面的yacc程序片段是main主程序includeincludechar*progname;intIineno=I;main(argc,argv)intargc;char*argv;progname=argv0;yyparse();main主程序调用yyparse子程序来处理来处理输入,而yyparse又是通过yylex子程序来获得输入单词并通过yyerror子程序
9、来报告出错信息。下面是有关这两个子程序的yacc程序片段yylex0intc;while(c=getchar()=Ic=-t,);if(c=EOF)return0;if(c=三,.,IIisdigit(c)ungetc(c,stdin);scanf(z,%lfzz,&yylval);returnNUMBER;if(c=三,n,)lineno+;returnc;)yyerror(三)char*s;warning(s,(char*)0);)warning(s,t)char*s,*t;fprintf(stderr,z,%s%sz,progname,s);if(t)fprintf(stderr,%s”
10、,t);fprintf(stderr,zznearline%dn,z,Iineno);)这样就完成了整个yacc程序接下来就使用yacc将hoc.y转换成C语言程序$yacchoc.y使用上述命令产生的C语言程序为y.tab.c,这时可以使用C编译程序将它编译成可执行程序hoc.$CCy.tab.c-ohoc下面是使用hoc的例子#./hoc4*3*224(1+2)*(3+4)211/20.5355/1332.6691729-3-4./hoc:Syntaxerrornearline5上述结果显示中,分别表明了计算结果,最后一次计算出错的原因是由于在规则定义中未来定义单目减运算符号。Yacc与1
11、.ex快速入门1.ex与Yacc介绍AshishBansal软件工程师,Sapient公司2000年11月内容:1.ex1.ex常规表达式1.ex编程C与1.ex的全局声明1.ex模式规则C代码将它们全部结合起来高级1.exYacc使用Yacc编写语法C与Yacc的声明Yacc语法规则附加C代码其他命令行选项将1.eX与Yacc结合起来资源作者介绍1.ex和Yacc是UNIX的两种非常重要的、功能强大的工具。事实上,如果你熟练掌握1.ex和Yacc的话,它们的强大功能使创建FORTRAN和C的编译器如同儿戏。AshishBansal为您详细的讨论了编写自己的语言和编译器所用到的这两种工具,包括
12、常规表达式、声明、匹配模式、变量、YaCC语法和解析器代码。最后,馈土嗽趾?1.ex和Yacc结合起来。1.ex代表1.exicalAnalyzar0Yacc代表YetAnotherCompilerCompilero让我们从1.ex开始吧。1.ex1.ex是一种生成扫描器的工具。扫描器是一种识别文本中的词汇模式的程序。这些词汇模式(或者常规表达式)在一种特殊的句子结构中定义,这个我们一会儿就要讨论。一种匹配的常规表达式可能会包含相关的动作。这一动作可能还包括返回一个标记。当1.ex接收到文件或文本形式的输入时,它试图将文本与常规表达式进行匹配。它一次读入一个输入字符,直到找到一个匹配的模式。如
13、果能够找到一个匹配的模式,1.ex就执行相关的动作(可能包括返回一个标记)。另一方面,如果没有可以匹配的常规表达式,将会停止进一步的处理,1.ex将显示一个错误消息。1.ex和C是强耦合的。一个.Iex文件(1.ex文件具有.Iex的扩展名)通过Iex公用程序来传递,并生成C的输出文件。这些文件被编译为词法分析器的可执行版本。1.ex的常规表达式常规表达式是一种使用元语言的模式描述。表达式由符号组成。符号一般是字符和数字,但是1.ex中还有一些具有特殊含义的其他标记。下面两个表格定义了1.ex中使用的一些标记并给出了几个典型的例子。用1.ex定义常规表达式字符含义A-Z,0-9,a-z构成了部
14、分模式的字符和数字。匹配任意字符,除了n。用来指定范围。例如:A-Z指从A到Z之间的所有字符。一个字符集合。匹配括号内的任意字符。如果第一个字符是C那么它表示否定模式。例如:abC匹配a,b,和C中的任何一个。*匹配O个或者多个上述的模式。+匹配1个或者多个上述模式。9匹配O个或1个上述模式。$作为模式的最后一个字符匹配一行的结尾。指出一个模式可能出现的次数。例如:Al,3表示A可能出现1次或3次。用来转义元字符。同样用来覆盖字符在此表中定义的特殊意义,只取字符的本意。否定。I表达式间的逻辑或。一些符号字符的字面含义。元字符具有。/向前匹配。如果在匹配的模版中的后跟有后续表达式,只匹配模版中前面的部分。如:如果输入01,那么在模版0l中的AO是匹配的。()将一系列常规表达式分组。常规表达式举例常规表达式含义jokers匹配jokes或jokeroAl,2shis+匹配shis,Ashis,Ashi,Ashi0(Ab-e)+匹配在A出现位置后跟