CPython 实现原理
  • README
  • 一、简介
    • 1.1 如何使用此书
    • 1.2 额外材料和学习资料
  • 二、获取 CPython 源码
    • 2.1 源代码里有什么?
  • 三、准备你的开发环境
    • 3.1 选IDE还是编辑器?
    • 3.2 安装Visual Studio
    • 3.3 安装Visual Studio Code
    • 3.4 安装JetBrains Clion
    • 3.5 安装Vim
    • 3.6 总结
  • 四、编译 CPython
    • 4.1 在 macOS 上编译 CPython
    • 4.2 在 Linux 上编译 CPython
    • 4.3 安装自定义版本
    • 4.4 make 快速入门
    • 4.5 CPython 的 make 目标
    • 4.6 在 Windows 上编译 CPython
    • 4.7 PGO 优化
    • 4.8 总结
  • 五、Python 语言和语法
    • 5.1 为什么 CPython 是用 C 语言而不是用 Python 语言来实现
    • 5.2 Python 语言规范
    • 5.3 分析器生成器
    • 5.4 重新生成语法
    • 5.5 总结
  • 六、配置和输入
    • 6.1 配置状态
    • 6.2 构建配置
    • 6.3 从输入构建模块
    • 6.4 总结
  • 七、基于语法树的词法分析和解析
    • 7.1 具象语法树生成器
    • 7.2 CPython 解析器-分词器
    • 7.3 抽象语法树
    • 7.4 要记住的术语
    • 7.5 一个示例:添加一个约等于比较运算法
    • 7.6 总结
  • 八、编译器
    • 8.1 相关源文件
    • 8.2 重要的专业术语
    • 8.3 实例化一个编译器
    • 8.4 未来标志和编译器标志
    • 8.5 符号表
    • 8.6 核心编译过程
    • 8.7 汇编
    • 8.8 创建一个 Code Object
    • 8.9 使用 Instaviz 展示 Code Object
    • 8.10 一个示例:实现约等于操作符
    • 8.11 总结
  • 九、求值循环
    • 9.1 构建线程状态
    • 9.2 构建帧对象
    • 9.3 帧的执行
    • 9.4 值栈
    • 9.5 例子:在列表中添加元素
    • 9.6 总结
  • 十、内存管理
    • 10.1 C 中的内存分配
    • 10.2 Python 内存管理系统设计
    • 10.3 CPython 内存分配器
  • 十一、并行和并发
    • 11.1 并行和并发模型
    • 11.2 进程的结构
    • 11.3 多进程并行
    • 11.4 多线程
    • 11.5 异步编程
    • 11.6 生成器
    • 11.7 协程
    • 11.8 异步生成器
    • 11.9 子解释器
    • 11.10 总结
  • 十二、对象和类型
    • 12.1 本章的例子
    • 12.2 内置类型
    • 12.3 对象和可变长度对象类型
    • 12.4 类型类
    • 12.5 布尔和整数类型
    • 12.6 Unicode 字符串类型
    • 12.7 字典类型
    • 12.8 总结
  • 十三、标准库
    • 13.1 Python 模块
    • 13.2 Python 和 C 模块
  • 十四、测试套件
    • 14.1 在 Windows 上运行测试套件
    • 14.2 在 Linux 或 MacOS 上运行测试套件
    • 14.3 测试标志
    • 14.4 运行特定测试
    • 14.5 测试模块
    • 14.6 测试工具
    • 14.7 总结
  • 十五、调试
  • 十六、基准测试、性能分析和追踪
  • 十七、下一步计划
    • 17.1 为 CPython 编写 C 扩展
    • 17.2 改进你的 Python 应用程序
    • 17.3 为 CPython 项目做贡献
    • 17.4 继续学习
  • 十八、附录
    • 18.1 C 预处理器
    • 18.2 基础 C 语法
    • 18.3 总结
  • 致谢
Powered by GitBook
On this page
Edit on GitHub
  1. 五、Python 语言和语法

5.1 为什么 CPython 是用 C 语言而不是用 Python 语言来实现

Previous五、Python 语言和语法Next5.2 Python 语言规范

Last updated 2 years ago

CPython 中的 C 来源于 C 语言,这表明 Python 发行版本是用 C 语言写的。

这个结论基本是正确的:CPython 中的编译器是用纯 C 语言写的。但是许多的标准库模块是用纯 Python 语言或者是 C 及 Python 语言混写而成。

所以为什么 CPython 编译器是用 C 语言而不是 Python 语言来实现?

这个问题的答案在于编译器是如何工作的。主要有两种类型的编译器:

  1. 自编译编译器:是用他们要编译的语言所写成的编译器,比如:Go 编译器。这个过程是由一个称为“自举”的过程所实现;

  2. 源到源编译器:是用另一种已经有编译器的语言实现的编译器。

如果你想从零开始写一门新的编程语言,则你需要一个可执行应用来编译你的编译器!正是由于需要一个能做任何事情的编译器,所以在开发一门新语言的初始阶段时通常需要用一种更老、更稳定的语言来编写。

还有一些工具可以使用语言规范创建分析器,你将在本章后面了解到这一点。主流的编译器生成器有:GNU Bison,Yacc 和 ANTLR。

See Aslo

如果你想了解更多关于分析器的信息,那么可以下载并查看 项目。lark 是一个用 Python 编写的上下文无关文法的分析器。

一个编译器自举的优秀案例是 Go 编程语言。第一个 Go 编译器其实是用 C 语言写的,但当 Go 语言可以被 Go 编译器顺利编译出来后,Go 编译器中 C 语言部分就被 Go 语言慢慢重写替代掉。

另一方面,CPython 保留了 C 语言的实现。许多标准库模块,如:ssl 模块或者 sockets 模块,都是用 C 语言编写的以访问底层操作系统 API。

Windows 和 Linux 内核中用来创建网络套接字、使用文件系统或者和显示器交互的 API 都是用 C 语言编写的。因此,Python 的扩展模块主要用 C 语言实现是合理的。在本书的后续章节,你会了解到 Python 标准库和 C 模块。

还有一个用 Python 语言实现的 Python 编译器叫做:。PyPy 的logo是一条,用这个logo来表达本身的自编译特性。

Python 交叉编译器的另一个例子是 。Jython 是用 Java 语言编写的并且可以将 Python 源码编译为 Java 字节码。Jython 使得引用 Java 模块及相关类变得更简单,就像在 CPython 中导入 C 库以及在 Python 语言中使用它们更加简单。

创建编译器的第一步是要定义语言。如下示例不是一个有效的 Python 代码:

def my_example() <str>:
{
    void* result = ;
}

编译器在编译代码之前,需要有严格的语法结构规则。

注

对于本书的剩余部分,./python 特指 CPython 的编译版本。但实际的命令依赖于你的操作系统。

对于 Windows:

> python.exe

对于 Linux:

$ ./python

对于 MacOS:

$ ./python

lark
PyPy
衔尾蛇
Jython