CPython 实现原理
  • README
  • 一、简介
    • 1.1 如何使用此书
    • 1.2 额外材料和学习资料
  • 二、获取 CPython 源码
    • 2.1 源代码里有什么?
  • 三、准备你的开发环境
    • 3.1 选IDE还是编辑器?
    • 3.2 安装Visual Studio
    • 3.3 安装Visual Studio Code
    • 3.4 安装JetBrains Clion
    • 3.5 安装Vim
    • 3.6 总结
  • 四、编译 CPython
    • 4.1 在 macOS 上编译 CPython
    • 4.2 在 Linux 上编译 CPython
    • 4.3 安装自定义版本
    • 4.4 make 快速入门
    • 4.5 CPython 的 make 目标
    • 4.6 在 Windows 上编译 CPython
    • 4.7 PGO 优化
    • 4.8 总结
  • 五、Python 语言和语法
    • 5.1 为什么 CPython 是用 C 语言而不是用 Python 语言来实现
    • 5.2 Python 语言规范
    • 5.3 分析器生成器
    • 5.4 重新生成语法
    • 5.5 总结
  • 六、配置和输入
    • 6.1 配置状态
    • 6.2 构建配置
    • 6.3 从输入构建模块
    • 6.4 总结
  • 七、基于语法树的词法分析和解析
    • 7.1 具象语法树生成器
    • 7.2 CPython 解析器-分词器
    • 7.3 抽象语法树
    • 7.4 要记住的术语
    • 7.5 一个示例:添加一个约等于比较运算法
    • 7.6 总结
  • 八、编译器
    • 8.1 相关源文件
    • 8.2 重要的专业术语
    • 8.3 实例化一个编译器
    • 8.4 未来标志和编译器标志
    • 8.5 符号表
    • 8.6 核心编译过程
    • 8.7 汇编
    • 8.8 创建一个 Code Object
    • 8.9 使用 Instaviz 展示 Code Object
    • 8.10 一个示例:实现约等于操作符
    • 8.11 总结
  • 九、求值循环
    • 9.1 构建线程状态
    • 9.2 构建帧对象
    • 9.3 帧的执行
    • 9.4 值栈
    • 9.5 例子:在列表中添加元素
    • 9.6 总结
  • 十、内存管理
    • 10.1 C 中的内存分配
    • 10.2 Python 内存管理系统设计
    • 10.3 CPython 内存分配器
  • 十一、并行和并发
    • 11.1 并行和并发模型
    • 11.2 进程的结构
    • 11.3 多进程并行
    • 11.4 多线程
    • 11.5 异步编程
    • 11.6 生成器
    • 11.7 协程
    • 11.8 异步生成器
    • 11.9 子解释器
    • 11.10 总结
  • 十二、对象和类型
    • 12.1 本章的例子
    • 12.2 内置类型
    • 12.3 对象和可变长度对象类型
    • 12.4 类型类
    • 12.5 布尔和整数类型
    • 12.6 Unicode 字符串类型
    • 12.7 字典类型
    • 12.8 总结
  • 十三、标准库
    • 13.1 Python 模块
    • 13.2 Python 和 C 模块
  • 十四、测试套件
    • 14.1 在 Windows 上运行测试套件
    • 14.2 在 Linux 或 MacOS 上运行测试套件
    • 14.3 测试标志
    • 14.4 运行特定测试
    • 14.5 测试模块
    • 14.6 测试工具
    • 14.7 总结
  • 十五、调试
  • 十六、基准测试、性能分析和追踪
  • 十七、下一步计划
    • 17.1 为 CPython 编写 C 扩展
    • 17.2 改进你的 Python 应用程序
    • 17.3 为 CPython 项目做贡献
    • 17.4 继续学习
  • 十八、附录
    • 18.1 C 预处理器
    • 18.2 基础 C 语法
    • 18.3 总结
  • 致谢
Powered by GitBook
On this page
  • long类型
  • 例子
Edit on GitHub
  1. 十二、对象和类型

12.5 布尔和整数类型

bool 类型是内置类型中最直接的实现。它继承自 long,并且有预定义的常量,Py_True 和 Py_False。这些常量是**不可变(immutable)**实例,在 Python 解释器的初始化过程中创建。

在 Objects/boolobject.c 中,你可以看到从整数创建 bool 类型实例的辅助函数。

Objects/boolobject.c 第 28 行

PyObject *PyBool_FromLong(long ok)
{
    PyObject *result;

    if (ok)
        result = Py_True;
    else
        result = Py_False;
    Py_INCREF(result);
    return result;
}

这个函数使用 C 语言对一个整数进行判断,result 结果为 Py_True 或 Py_False,最后把 result 的引用计数加一。

bool 类型实现了 and、xor 和 or 操作对应的数值函数,但在从 long 继承的过程中删除了加法、减法和除法,因为将两个布尔值相除是没有意义的。

对于 bool,and 的实现首先检查 a 和 b 是否是 bool 值。如果不是,它们被转成整数,然后对这两个整数进行和运算。

Objects/boolobject.c 第 61 行

static PyObject *
bool_and(PyObject *a, PyObject *b)
{
    if (!PyBool_Check(a) || !PyBool_Check(b))
        return PyLong_Type.tp_as_number->nb_and(a, b);
    return PyBool_FromLong((a == Py_True) & (b == Py_True));
}

long类型

long 类型比 bool 类型稍微复杂一点。在从 Python 2 迁移到 Python 3 的过程中,CPython 抛弃了对 int 类型的支持,并且使用 long s作为主要的整数类型。

Python 的 long 类型比较特别,它可以存储长度可变的整数。最大长度被设置在编译出来的二进制文件中。

Python long 数据结构由 PyObject_VAR_HEAD 和一个数字数组组成。数字数组 ob_digit 最开始长度为 1,在初始化时它可以扩展到更长的长度。

Include/longintrepr.h 第85行

struct _longobject {
    PyObject_VAR_HEAD
    digit ob_digit[1];
};

比如,整数 1 为 ob_digits [1],整数 24601 为 ob_digits [2, 4, 6, 0, 1]。

内存通过 _PyLong_New() 分配给一个新的 long。这个函数接收一个固定的长度,并确保它小于 MAX_LONG_DIGITS。

然后它为 ob_digit 重新分配内存,使之与这个长度相匹配。

为了将 C 语言的 long 类型转换为 Python 语言的 long 类型,首先 C 语言的 long 被转换为一个数字列表,然后为 Python 语言的 long 分配内存,最后设置每个数字。

对于个位数的数字,long 对象将使用长度为 1 的 ob_digit 进行初始化。然后,在不分配内存的情况下设置数值。

Objects/longobject.c 第 297 行

PyObject *
PyLong_FromLong(long ival)
{
    PyLongObject *v;
    unsigned long abs_ival;
    unsigned long t;
    /* unsigned so >> doesn't propagate sign bit */
    int ndigits = 0;
    int sign;
    CHECK_SMALL_INT(ival);
    ...
    /* Fast path for single-digit ints */
    if (!(abs_ival >> PyLong_SHIFT)) {
        v = _PyLong_New(1);
        if (v) {
            Py_SIZE(v) = sign;
            v->ob_digit[0] = Py_SAFE_DOWNCAST(
                abs_ival, unsigned long, digit);
        }
        return (PyObject*)v;
    }
...
    /* Larger numbers: loop to determine number of digits */
    t = abs_ival;
    while (t) {
        ++ndigits;
        t >>= PyLong_SHIFT;
    }
    v = _PyLong_New(ndigits);
    if (v != NULL) {
        digit *p = v->ob_digit;
        Py_SIZE(v) = ndigits*sign;
        t = abs_ival;
        while (t) {
            *p++ = Py_SAFE_DOWNCAST(
            t & PyLong_MASK, unsigned long, digit);
            t >>= PyLong_SHIFT;
        }
    }
    return (PyObject *)v;
}

如果想把一个双精度浮点数转换为 Python long 类型,可以使用 PyLong_FromDouble(),它为你做了相关数学计算。

在 Objects/longobject.c 中的其余函数都有各自的功能,比如 PyLong_FromUnicodeObject() 可以将 Unicode 字符串转换为数字。

例子

long 的 rich-comparison 的类型槽被设置为 long_richcompare()。这个函数封装了long_compare()。

Objects/longobject.c 第3031行

static PyObject *
long_richcompare(PyObject *self, PyObject *other, int op)
{
    Py_ssize_t result;
    CHECK_BINOP(self, other);
    if (self == other)
        result = 0;
    else
        result = long_compare((PyLongObject*)self, (PyLongObject*)other);
    Py_RETURN_RICHCOMPARE(result, 0, op);
}

long_compare() 将首先检查两个变量 a 和 b 的长度(位数),如果长度相同,那么它将遍历每个数字,看它们是否相互相等。

long_compare() 返回以下三种结果之一。

  1. 如果 a < b,那么它返回一个负数。

  2. 如果 a == b,那么它返回 0。

  3. 如果 a > b,那么它返回一个正数。

比如执行 1 == 5,结果是 -4。 对于 5 == 1,结果则是 4。

你可以在 Py_RETURN_RICHCOMPARE 宏之前实现以下代码块,以在结果的绝对值 <=1 时返回 True。 它使用宏 Py_ABS() 返回有符号整数的绝对值:

    if (op == Py_AlE) {
        if (Py_ABS(result) <= 1)
            Py_RETURN_TRUE;
        else
            Py_RETURN_FALSE;
    }
    Py_RETURN_RICHCOMPARE(result, 0, op);
}

重新编译 Python 后,你可以看到改动后的效果:

>>> 2 == 1
False
>>> 2 ~= 1
True
>>> 2 ~= 10
False
Previous12.4 类型类Next12.6 Unicode 字符串类型

Last updated 2 years ago