8.5 符号表
在编译代码之前,PySymtable_BuildObject()
API 会创建出一个符号表(symbol table)。
符号表的目的是提供命名空间、全局和局部的列表,供编译器用于引用和解析作用域。
相关源文件
下面是与符号表相关的源文件:
文件 | 用途 |
---|---|
Python/symtable.c | 符号表实现 |
Include/symtable.h | 符号表 API 定义和类型定义 |
Lib/symtable.py |
|
符号表数据结构
symtable
结构应该是编译器的一个 symtable
实例,因此命名空间变得至关重要。
例如,如果你在一个类中创建了一个叫做 resolve_names()
的方法,并在另一个类中也声明了一个同名的方法,那么你需要确定哪个方法要在模块内被调用。
symtable
服务于此目的,同时确保在狭窄范围内声明的变量不会自动成为全局变量。
符号表结构(symtable
)具有以下字段:
字段 | 类型 | 用途 |
---|---|---|
recursion_depth | int | 当前递归深度 |
recursion_limit | int | 引发 |
st_blocks | PyObject * (dict) | AST 节点地址到符号表项的映射 |
st_cur | _symtable_entry | 当前符号表项 |
st_filename | PyObject * (str) | 正在编译的文件名 |
st_future | PyFutureFeatures | 影响符号表的模块未来特性 |
st_global | PyObject * (dict) | 对 |
st_nblocks | int | 使用的块数 |
st_private | PyObject * (str) | 当前类的名字(可选) |
st_stack | PyObject * (list) | 命名空间信息栈 |
st_top | _symtable_entry | 模块的符号表项 |
使用 symtable 标准库模块
有些符号表 C API 通过标准库中的 symtable
模块在 Python 中公开出来。
使用另一个称为 tabulate
(可在 PyPI 上获取)的模块,你可以创建一个脚本来打印符号表。
符号表可以嵌套,因此如果模块包含函数或类,则该模块将具有符号表。
创建一个名为 symviz.py
的脚本,并有一个递归 show()
函数:
在命令行运行 symviz.py
以查看示例代码的符号表:
图片不翻译
符号表实现
符号表的实现在 Python/symtable.c
中,并且主接口是 PySymtable_BuildObject()
。
与上一章所讲到的 AST 编译类似,PySymtable_BuildObject()
在 mod_ty
的可能类型(Module、Interactive、Expression 和 FunctionType)之间切换并访问其中的每个语句。
符号表递归地探索 AST(mod_ty
类型)的节点和分支,并将条目添加到 symtable
中:
对于模块而言,PySymtable_BuildObject()
会循环遍历模块中的每个语句并调用 Symtable_visit_stmt()
,这是一个巨大的 switch
语句,并且每个语句类型都有一个与之对应的 case
(在 Parser/Python.asdl
中定义)。
每个语句类型都有相应的函数来解析符号。例如,函数定义(FunctionDef_kind
)语句类型对以下操作具有特定的逻辑:
根据递归限制检查当前递归深度;
将函数的名称添加到符号表中,以便它可以作为函数对象被调用或传递;
解析符号表中的非字面量默认参数;
解析类型注解;
解析函数装饰器。
最后,symtable_enter_block()
访问带有函数内容的块,然后访问并解析参数和函数体。
重要
如果你曾经想知道为什么 Python 的默认参数是可变的,原因就在 symtable_visit_stmt()
中。参数默认值是对 symtable
中变量的引用。
将任何值复制到不可变类型不需要做额外的工作。
以下是在 symtable_visit_stmt()
中为函数构建 symtable
相关步骤的C代码:
代码不翻译
一旦创建了结果符号表,它就会传递到编译器中。
Last updated