Bison(yacc)如何正常退出以及返回值

之前说过如何将Bison的输入源改为指定字符串。
然而当我将输入源改为指定字符串之后,发现遇到了一个很奇怪的问题:
yyparse无论如何都会调用yyerror进行报错。
本来我准备在yyerror里进行内存的释放,这样一来,无论分析成功与否,内存都会被释放,导致分析的结果都没了。

比如如下的bison代码:

calc: expr '=' { calculate($1); }
    ;

expr: ...

每一次程序运行在成功解析,调用了calculate函数之后,都会再调用yyerror,似乎哪里出了问题。
那么怎么才能让yyparse正常返回呢?

首先这里先说明一下bison的返回值。 我看了看源码,Bison的返回值有三个:0,1,2。
0代表运行成功,正常退出;
1代表解析发生错误,语法不匹配;
2代表内存耗尽。
因此Bison似乎是不支持自定义返回值的(至少我没有找到任何资料……)。所有的返回值似乎只能从参数列表中传入。

然后我仔细研究了一下生产的C代码,发现了如下三种可以让Bison正常退出的方法:

  1. 在你想要结束的规则中直接返回。
    比如如下代码:
    calc: expr '=' { calculate($1); return 0; }
        ;
    expr: ...
    
    我一次只想分析一个表达式,一旦计算成功,直接退出分析。那么我就可以在最终计算表达式的规则calc里直接返回。
  2. 使用宏YYACCEPT
    和上面一样,只不过将return 0;改成YYACCEPT。区别是使用后者,bison还会进行一些额外操作(emmmmmm而我目前还没理解这些操作的用意是什么,但是至少使用前者直接返回并不会报错,也不会内存泄漏,结果也是正确的。因此我个人推荐能直接返回最好直接返回,可以节省时间)
    实例:
    calc: expr '=' { calculate($1); YYACCEPT; }
        ;
    expr: ...
    
  3. 在词法分析器中使用EOF,文件终结符
    读取文件时,都会使用文件终结符来标明文件的结束。对于文本文件,一般而言EOF被定义为-1(因为并不在ASCII码范围内)。
    其实并不一定非要用文件终结符,任何你想使用的,不会造成冲突的字符或者字符串都可以。比如说“JUST END”。
    先上代码:
    //Flex
    ...
    <<EOF>> { yyterminate(); }
    ...
    
    //Bison
    calc: expr '=' { calculate($1); }
        ;
    expr: ...
    
    对于Bison文件,完全不用修改。只需要在Flex代码中加一行即可。
    在Flex代码中,定义<<EOF>>代表文件终结符。此时调用flex定义的函数yyterminate即可(其实此时只要返回任意非正数即可,转到flex定义的yyterminate就会发现,其实这个宏定义函数其实就是return 0。而仔细看bison文件就会发现它其实认定任意非正数token值都是终结号)。
    而相比第二种方法,使用文件终结符,Bison会又多执行一些操作。

综合上面三种方法,第三种是没有任何风险的。第一种效率最快的。

(如有错漏,还望指摘)

原创文章 34 获赞 41 访问量 5956

猜你喜欢

转载自blog.csdn.net/qq_44844115/article/details/102627128