CPython 实现原理
  • README
  • 一、简介
    • 1.1 如何使用此书
    • 1.2 额外材料和学习资料
  • 二、获取 CPython 源码
    • 2.1 源代码里有什么?
  • 三、准备你的开发环境
    • 3.1 选IDE还是编辑器?
    • 3.2 安装Visual Studio
    • 3.3 安装Visual Studio Code
    • 3.4 安装JetBrains Clion
    • 3.5 安装Vim
    • 3.6 总结
  • 四、编译 CPython
    • 4.1 在 macOS 上编译 CPython
    • 4.2 在 Linux 上编译 CPython
    • 4.3 安装自定义版本
    • 4.4 make 快速入门
    • 4.5 CPython 的 make 目标
    • 4.6 在 Windows 上编译 CPython
    • 4.7 PGO 优化
    • 4.8 总结
  • 五、Python 语言和语法
    • 5.1 为什么 CPython 是用 C 语言而不是用 Python 语言来实现
    • 5.2 Python 语言规范
    • 5.3 分析器生成器
    • 5.4 重新生成语法
    • 5.5 总结
  • 六、配置和输入
    • 6.1 配置状态
    • 6.2 构建配置
    • 6.3 从输入构建模块
    • 6.4 总结
  • 七、基于语法树的词法分析和解析
    • 7.1 具象语法树生成器
    • 7.2 CPython 解析器-分词器
    • 7.3 抽象语法树
    • 7.4 要记住的术语
    • 7.5 一个示例:添加一个约等于比较运算法
    • 7.6 总结
  • 八、编译器
    • 8.1 相关源文件
    • 8.2 重要的专业术语
    • 8.3 实例化一个编译器
    • 8.4 未来标志和编译器标志
    • 8.5 符号表
    • 8.6 核心编译过程
    • 8.7 汇编
    • 8.8 创建一个 Code Object
    • 8.9 使用 Instaviz 展示 Code Object
    • 8.10 一个示例:实现约等于操作符
    • 8.11 总结
  • 九、求值循环
    • 9.1 构建线程状态
    • 9.2 构建帧对象
    • 9.3 帧的执行
    • 9.4 值栈
    • 9.5 例子:在列表中添加元素
    • 9.6 总结
  • 十、内存管理
    • 10.1 C 中的内存分配
    • 10.2 Python 内存管理系统设计
    • 10.3 CPython 内存分配器
  • 十一、并行和并发
    • 11.1 并行和并发模型
    • 11.2 进程的结构
    • 11.3 多进程并行
    • 11.4 多线程
    • 11.5 异步编程
    • 11.6 生成器
    • 11.7 协程
    • 11.8 异步生成器
    • 11.9 子解释器
    • 11.10 总结
  • 十二、对象和类型
    • 12.1 本章的例子
    • 12.2 内置类型
    • 12.3 对象和可变长度对象类型
    • 12.4 类型类
    • 12.5 布尔和整数类型
    • 12.6 Unicode 字符串类型
    • 12.7 字典类型
    • 12.8 总结
  • 十三、标准库
    • 13.1 Python 模块
    • 13.2 Python 和 C 模块
  • 十四、测试套件
    • 14.1 在 Windows 上运行测试套件
    • 14.2 在 Linux 或 MacOS 上运行测试套件
    • 14.3 测试标志
    • 14.4 运行特定测试
    • 14.5 测试模块
    • 14.6 测试工具
    • 14.7 总结
  • 十五、调试
  • 十六、基准测试、性能分析和追踪
  • 十七、下一步计划
    • 17.1 为 CPython 编写 C 扩展
    • 17.2 改进你的 Python 应用程序
    • 17.3 为 CPython 项目做贡献
    • 17.4 继续学习
  • 十八、附录
    • 18.1 C 预处理器
    • 18.2 基础 C 语法
    • 18.3 总结
  • 致谢
Powered by GitBook
On this page
  • #include
  • #define
  • #undef
  • #if
  • #pragma
  • #error
Edit on GitHub
  1. 十八、附录

18.1 C 预处理器

顾名思义,预处理器在编译器运行之前在源文件上运行。它的能力非常有限,但你可以在构建 C 程序时使用它们来发挥巨大的优势。

预处理器会生成一个新文件,这是编译器实际处理的文件。预处理器的所有命令都从行首开始,# 符号作为第一个非空白字符。

预处理器的主要用途是在源文件中执行文本替换,但它也会使用 #if 或类似的语句来执行一些基本的条件代码。

让我们从最常见的预处理器指令开始:#include。

#include

#include 用于将一个文件的内容拉取到当前源文件中。#include 没有什么复杂的内容。它从文件系统中读取文件,在该文件上运行预处理器,并将结果放入输出文件中。这是为每个 #include 指令递归达成的。

例如,如果你查看 Modules/_multiprocessing/semaphore.c 文件,那么在文件顶部附近,你将看到以下行:

#include "multiprocessing.h"

此行代码会告诉预处理器获取到 multi-processing.h 的全部内容,并将它们放入到输出文件的同个位置上。

你需要注意到 #include 语句有两种不同形式。其中一个使用引号("")指定所包含的文件名,另一个使用括号(<>)。两者区别在于在文件系统上查找文件时的搜索路径。

如果你使用 <> 作为文件名,则预处理器将仅查看系统包含文件。在文件名周围使用引号将强制预处理器首先查找本地目录,然后再回退到系统目录。

#define

#define 允许你执行简单的文本替换,还可以使用 #if 指令,你将会在下面看到。

在最基本的情况下,#define 允许你定义一个新的符号,该符号将在预处理器输出中替换文本字符串。

仍然是在 semphore.c 中,你会发现这样的一行文本:

#define SEM_FAILED NULL

此行文本告诉预处理器在将代码发送到编译器之前,用文本字符串 NULL 替换低于此行的 SEM_FAILED 的所有实例。

#define 定义项也可以在 Windows 特定版本的 SEM_CREATE 中使用参数:

#define SEM_CREATE(name, val, max) CreateSemaphore(NULL, val, max, NULL)

在这种情况下,预处理器将期望 SEM_CREATE()看起来像一个函数调用,并有三个参数。这通常被称为宏。它直接将这三个参数的文本替换到输出代码中。

例如,在 semphore.c 的第 460 行,SEM_CREATE 宏是这样使用的:

handle = SEM_CREATE(name, value, max);

当你为 Windows 编译时,此宏将被展开,使此行看起来像这样:

handle = CreateSemaphore(NULL, value, max, NULL);

在后面的章节中,你将看到此宏在 Windows 和其他操作系统上的定义有什么不同。

#undef

此指令将从 #define 中删除任何以前的预处理器定义。这使得 #define 仅对文件中的部分有效成为可能。

#if

预处理器还允许使用条件语句,允许你根据某些条件包括或排除文本部分。使用 #endif 指令来关闭条件语句,还可以使用 #elif 和 #else 进行微调。

你将在 CPython 源代码中看到 #if 的三种基本形式:

  1. 如果定义了指定的宏,则#ifdef <macro> 会包含后面的文本块。你还可以看到它被写成 #if defined(<macro>)。

  2. 如果没有定义指定的宏,则#ifndef <macro> 会包含后面的文本块。

  3. 如果定义了指定的宏并且求得的值为 True ,则#if <macro> 会包含后面的文本块。

这里要注意的是,使用“文本”而不是“代码”来描述文件中所包含或排除的内容,是因为预处理器对 C 语法一无所知,也不关心指定的文本是什么。

#pragma

Pragma 是编译器的指令或提示。一般来说,你可以在阅读代码时忽略这些代码,因为它们通常用于处理代码是如何编译的,而不是代码是如何运行的。

#error

最后,#error 会显示一条消息,并导致预处理器停止执行。同样,你在阅读 CPython 源代码时可以安全地忽略这些内容。

Previous十八、附录Next18.2 基础 C 语法

Last updated 2 years ago