Skulpt-源码浅析-Parser

2022-02-01
1. Skulpt

Skulpt中Parser是一个从cpython的lib2to3派生的解析器

该Parser采用了自底向上的语法分析，也就是从分析树的底部(叶节点)向顶部(根节点)方向构造分析树。

注: Skulpt 后来搞了一个 skulpt_parser 用于 python3.9 语法解析。python3.9提出了一个新的使用LL(1)的 Parser。

自底向上分析

自底向上的语法分析采用最左归约方式（反向构造最右推导），其通用的分析框架为移入-归约分析(Shift-Reduce Parsing)。

移入-归约分析

移入-归约分析的工作过程

在对输入串的一次从左到右扫描过程中，语法分析器将零个或多个输入符号移入到栈的顶端，
直到它可以对栈顶的一个文法符号串β进行归约为止

然后，它将β归约为某个产生式的左部

语法分析器不断地重复这个循环，直到它检测到一个语法错误，或者栈中包含了开始符号且输入缓冲区为空(当进入这样的格局时，语法分析器停止运行并宣称成功完成了语法分析)为止

移入-归约分析器可采取的4种动作

移入：将下一个输入符号移到栈的顶端

归约：被归约的符号串的右端必然处于栈顶。语法分析器在栈中确定这个串的左端，并决定用哪个非终结符来替换这个串

接收：宣布语法分析过程成功完成

报错：发现一个语法错误，并调用错误恢复子例程

LR分析法

LR文法(Knuth, 1963) 是最大的、可以构造出相应移入-归约语法分析器的文法类

L: 对输入进行从左到右的扫描

R: 反向构造出一个最右推导序列

K: 需要向前查看k个输入符号的LR分析。 k = 0 和 k = 1 这两种情况具有实践意义。当省略(k)时，表示k=1

LR分析器的总体结构：

LR算法流程：

Skulpt Parser

parse

parse 需要 filename、input 参数，其中：filename 被 makeParser 用于构造 Parser对象， input 被 readline 用于构造字符流。

Sk._tokenize 是一个词法分析器，解析字符流形成符号流，编码为utf-8

Skulpt-源码浅析-Parser

自底向上分析

移入-归约分析

LR分析法

Skulpt Parser

parse

Parser的构造

addtoken

classify

push

shift

pop

参考资料

Skulpt-源码浅析-Parser

自底向上分析

移入-归约分析

LR分析法

Skulpt Parser

parse

Parser的构造

addtoken

classify

push

shift

pop

参考资料

Recent articles

Tag

Categories