CPython 实现原理
  • README
  • 一、简介
    • 1.1 如何使用此书
    • 1.2 额外材料和学习资料
  • 二、获取 CPython 源码
    • 2.1 源代码里有什么?
  • 三、准备你的开发环境
    • 3.1 选IDE还是编辑器?
    • 3.2 安装Visual Studio
    • 3.3 安装Visual Studio Code
    • 3.4 安装JetBrains Clion
    • 3.5 安装Vim
    • 3.6 总结
  • 四、编译 CPython
    • 4.1 在 macOS 上编译 CPython
    • 4.2 在 Linux 上编译 CPython
    • 4.3 安装自定义版本
    • 4.4 make 快速入门
    • 4.5 CPython 的 make 目标
    • 4.6 在 Windows 上编译 CPython
    • 4.7 PGO 优化
    • 4.8 总结
  • 五、Python 语言和语法
    • 5.1 为什么 CPython 是用 C 语言而不是用 Python 语言来实现
    • 5.2 Python 语言规范
    • 5.3 分析器生成器
    • 5.4 重新生成语法
    • 5.5 总结
  • 六、配置和输入
    • 6.1 配置状态
    • 6.2 构建配置
    • 6.3 从输入构建模块
    • 6.4 总结
  • 七、基于语法树的词法分析和解析
    • 7.1 具象语法树生成器
    • 7.2 CPython 解析器-分词器
    • 7.3 抽象语法树
    • 7.4 要记住的术语
    • 7.5 一个示例:添加一个约等于比较运算法
    • 7.6 总结
  • 八、编译器
    • 8.1 相关源文件
    • 8.2 重要的专业术语
    • 8.3 实例化一个编译器
    • 8.4 未来标志和编译器标志
    • 8.5 符号表
    • 8.6 核心编译过程
    • 8.7 汇编
    • 8.8 创建一个 Code Object
    • 8.9 使用 Instaviz 展示 Code Object
    • 8.10 一个示例:实现约等于操作符
    • 8.11 总结
  • 九、求值循环
    • 9.1 构建线程状态
    • 9.2 构建帧对象
    • 9.3 帧的执行
    • 9.4 值栈
    • 9.5 例子:在列表中添加元素
    • 9.6 总结
  • 十、内存管理
    • 10.1 C 中的内存分配
    • 10.2 Python 内存管理系统设计
    • 10.3 CPython 内存分配器
  • 十一、并行和并发
    • 11.1 并行和并发模型
    • 11.2 进程的结构
    • 11.3 多进程并行
    • 11.4 多线程
    • 11.5 异步编程
    • 11.6 生成器
    • 11.7 协程
    • 11.8 异步生成器
    • 11.9 子解释器
    • 11.10 总结
  • 十二、对象和类型
    • 12.1 本章的例子
    • 12.2 内置类型
    • 12.3 对象和可变长度对象类型
    • 12.4 类型类
    • 12.5 布尔和整数类型
    • 12.6 Unicode 字符串类型
    • 12.7 字典类型
    • 12.8 总结
  • 十三、标准库
    • 13.1 Python 模块
    • 13.2 Python 和 C 模块
  • 十四、测试套件
    • 14.1 在 Windows 上运行测试套件
    • 14.2 在 Linux 或 MacOS 上运行测试套件
    • 14.3 测试标志
    • 14.4 运行特定测试
    • 14.5 测试模块
    • 14.6 测试工具
    • 14.7 总结
  • 十五、调试
  • 十六、基准测试、性能分析和追踪
  • 十七、下一步计划
    • 17.1 为 CPython 编写 C 扩展
    • 17.2 改进你的 Python 应用程序
    • 17.3 为 CPython 项目做贡献
    • 17.4 继续学习
  • 十八、附录
    • 18.1 C 预处理器
    • 18.2 基础 C 语法
    • 18.3 总结
  • 致谢
Powered by GitBook
On this page
  • 内存分配作用域
  • 内存分配器
Edit on GitHub
  1. 十、内存管理

10.2 Python 内存管理系统设计

Python 内存管理机制概述

由于 CPython 是基于 C 构建的,它也受到 C 中静态内存分配、自动内存分配和动态内存分配的约束。而 Python 语言的一些特性设计使得我们面临更多的挑战:

  1. Python 是一门动态类型的语言,变量的大小不能在编译阶段得到;

  2. 大多数 Python 的核心类型大小都是动态的,例如 list 类型可以是任意长度,dict 类型可以有任意数量的键,甚至连 int 大小也不是固定的。用户不需要指定这些类型的大小;

  3. Python 内的变量名可以复用于任意类型,例如:

>>> a_value = 1
>>> a_value = "Now I'm a string"
>>> a_value = ["Now" , "I'm" "a", "list"]

为了解决这些问题,CPython 十分依赖动态内存分配,同时借助垃圾回收(GC)和引用计数算法去保证分配的内存可以自动释放。

Python 对象的内存是通过一个统一 API 自动分配得到的,并不需要 Python 开发者自己去分配内存。这种设计也意味着 CPython 的标准库和核心模块都要使用该 API 去分配内存。

内存分配作用域

CPython 可以在 3 个层次的作用域上进行动态内存分配:

  1. 原始域:用于从系统的堆上分配内存,用于大块内存或非对象的内存分配;

  2. 对象域:用于所有 Python 对象的内存分配;

  3. PyMem 域:与 PYMEM_DOMAIN_OBJ 功能一致,用于支持旧版本 API。

每一个域都会实现相同函数接口:

  • _Alloc(size_t size) - 分配指定大小的内存,返回指向这块内存的指针;

  • _Calloc(size_t nelem, size_t elsize) - 分配 nelem 个长度为 size 的连续内存空间,并返回指向第一个内存块的指针;

  • _Realloc(void *ptr, size_t new_size) - 将指针指向的内存重新分配大小;

  • _Free(void *ptr) - 将指针指向的内存释放回堆中。

枚举变量 PyMemAllocatorDomain 将 CPython 中的 3 个作用域分别表示为 PYMEM_DOMAIN_RAW, PYMEM_DOMAIN_OBJ 和PYMEM_DOMAIN_MEM 。

内存分配器

CPython 中使用了两种内存分配器:

  1. 操作系统层面的内存分配器 malloc ,主要用于原始内存作用域;

  2. CPython 层面的内存分配器 pymalloc ,主要用于 PyMem 和对象内存作用域。

注

默认情况下,会将 CPython 的内存分配器pymalloc编译到 CPython 的可执行文件中。你可以通过将 pyconfig.h 中的WITH_PYMALLOC设置为 0,再重新编译 CPython 去禁用它。禁用之后,在为 PyMem 和对象域分配内存时将使用系统自带的内存分配 APIs。

如果你使用 debug 模式去编译 CPython (在 macOS/Linux 下添加 --with-pydebug 编译选项,或者在 Windows 下以 Debug 模式编译),则所有的内存分配函数都会切换到 Debug 模式下的实现。例如,如果你启用了 Debug 模式,当触发内存分配时调用的将会是 _PyMem_DebugAlloc() 而不是_PyMem_Alloc() 。

Previous10.1 C 中的内存分配Next10.3 CPython 内存分配器

Last updated 2 years ago