1.5 Python 3和Python 2的主要差异_Python高级编程（第2版）-QQ阅读男生玄幻网

上QQ阅读APP看书，第一时间看更新

1.5 Python 3和Python 2的主要差异

前面已经说过，Python 3打破了对Python 2的向后兼容。但它并不是完全重新设计的。而且，也并不是说2.x版本的Python模块在Python 3下都无法运行。代码可以完全跨版本兼容，无需其他工具或技术在两大版本上都可以运行，但一般只有简单应用才能做到这一点。

1.5.1 为什么要关注这些差异

本章前面说过我个人对Python 2兼容性的看法，但是目前不可能完全忽视这一点。还有一些Python包（例如第6章将讲到的fabric）十分实用，但可能短期内不会迁移到Python 3。

另外，有时我们还会受到所在公司的制约。现有的遗留代码可能非常复杂，迁移代码的费用难以承受。所以即使我们现在决定只用Python 3，短期内也不可能完全放弃Python 2。

如今想要自称专业开发者，没有对社区的回馈是说不过去的，所以帮助开源软件开发者向现有软件包中添加对Python 3的兼容，可以很好地偿还在使用这些软件包时产生的“道德债（moral debt）”。当然，不了解Python 2和Python 3的差异是无法做到这一点的。顺便提一下，对于Python 3新手来说，这也是一项很好的练习。

1.5.2 主要的语法差异和常见陷阱

要比较不同版本之间的差异，最好的参考资料就是Python文档。不过为了方便读者，本节总结了其中最重要的内容。但不熟悉Python 3的读者还是要去阅读官方文档。

Python 3引入的重要差异一般可分为以下几个方面。

• 语法变化，删除/修改了一些语法元素，并添加了一些新的语法元素。

• 标准库中的变化。

• 数据类型与集合的变化。

1．语法变化

有些语法变化会导致当前代码无法运行，这些变化是最容易发现的，它们会导致代码根本无法运行。包含新语法元素的Python 3代码在Python 2中无法运行，反之亦然。由于删除了某些元素，导致Python 2代码显然无法与Python 3兼容。运行有这些问题的代码时，解释器很快就会抛出SyntaxError异常。下面是一个无法运行的脚本示例，只包含两个语句，都会引发语法错误而无法运行：

          print("hello world")
          print "goodbye python2"

上述代码在Python 3中的实际运行结果如下：

        $ python3 script.py
          File "script.py", line 2
            print "goodbye python2"
                                  ^
        SyntaxError: Missing parentheses in call to 'print'

列出所有的语法差异会比较长，而且Python 3.x的新版本也会不时添加新的语法元素，在较早版本的Python中就会引发错误（即使在相同的3.x版本上也会报错）。其中最重要的语法差异将会在第2章和第3章中讲到，所以这里无需全部列出。

与Python 2.7相比，删除或改动的内容要相对少一些，下面给出最重要的变化内容。

• print不再是一条语句而是一个函数，所以必须加上括号。

• 捕获异常的语法由except exc, var改为except exc as var。

• 弃用比较运算符<>，改用！=。

• from module import ＊（https://docs.python.org/3.0/reference/simple_stmts.html#import）现在只能用于模块，不能用在函数中。

• 现在from .[module] import name是相对导入的唯一正确的语法。所有不以点字符开头的导入都被当作绝对导入。

• sorted函数与列表的sort方法不再接受cmp参数，应该用key参数来代替。

• 整数除法表达式（如1/2）返回的是浮点数。取整运算可以用//运算符，如1//2。这样做的好处是浮点数也可以用这个运算符，所以5.0//2.0==2.0。

2．标准库中的变化

语法变化很容易发现，标准库中的重大变化也是非常容易发现的。Python的每个后续版本都会向标准库模块中添加、弃用、改进或完全删除某些内容。在旧版Python（1.x和2.x）中也会定期有这样的变化，所以出现在Python 3中并不让人吃惊。大多数情况下，对于删除或重组的模块（例如urlparse移到了urllib.parse），在运行解释器时会对导入语句抛出异常。这样的问题很容易发现。无论如何，为了确保能够发现所有类似的问题，完整的代码测试覆盖率是必不可少的。在某些情况下（例如使用延迟加载模块时），这个通常在全局导入时出现的问题并不会出现，直到在代码中将某些模块作为函数调用时才会出现。因此，在测试期间确保每行代码都要实际运行是很重要的。

延迟加载模块

延迟加载模块是指在全局导入时并不加载的模块。在Python中，import语句可以包含在函数内部，这样导入是在函数调用时才会发生，而不是在全局导入时发生。在某些情况下，模块的这种加载方式可能比较合理，但大多数情况下，这只是对设计不佳的模块结构的变通方法（例如避免循环导入），通常应避免这种加载方式。当然，对于标准库模块来说，没有理由使用延迟加载。

3．数据类型与集合的变化

开发人员在努力保持兼容性或只是将现有代码迁移到Python 3上时，需要特别注意Python中数据类型与集合的表示方式的变化。虽然不兼容的语法变化或标准库变化很容易发现，也很容易修复，但集合与数据类型的变化要么难以察觉，要么需要大量的重复工作。这样的变化列表会很长，再次重申，官方文档是最好的参考资料。

不过，这一节必须讲一下Python 3中字符串处理方式的变化，因为这是Python 3中最具争议也是讨论最多的变化，尽管这是一件好事，使很多问题变得更加明确。

现在所有字符串都是Unicode，字节（bytes）需要加一个b或B的前缀。Python 3.0和3.1不支持使用u前缀（例如u"foo"），使用的话会引发语法错误。不支持这个前缀是引发所有争议的主要原因。这导致难以编写能够兼容Python不同分支的代码，2.x版需要用这个前缀来创建Unicode。Python 3.3又恢复了这个前缀，虽然没有任何语法上的意义，只是为了简化兼容过程。

1.5.3 用于保持跨版本兼容性的常用工具和技术

在Python不同版本之间保持兼容性是一项挑战。根据项目的大小不同，这项挑战可能会增加许多额外的工作量，但绝对可行，也很值得去做。对于在许多环境中都会用到的Python包来说，必须要保持跨版本兼容性。如果开源包没有定义明确并经过测试的兼容范围（compatibility bound），是不太可能流行起来的。而且，对于只在公司网络封闭使用的第三方代码来说，也可以大大受益于在不同环境中的测试。

这里应该注意，虽然这一部分内容主要关注Python不同版本之间的兼容，但这些方法也适用于保持与外部依赖项之间的兼容，外部依赖项包括不同的包版本、二进制库、系统或外部服务等。

整个过程主要分为3个部分，按重要性排序如下。

• 定义并记录目标兼容范围的及其管理方法。

• 在每个环境中进行测试，并对每个兼容的依赖版本进行测试。

• 实现实际的兼容代码。

告知兼容范围是整个过程中最重要的一部分，因为这可以让代码使用者（开发人员）对代码的工作原理和未来的变化方式有一定的预期和假设。我们的代码可能用于多个不同项目的依赖，这些项目也在努力管理兼容性，所以把代码兼容性说清楚还是很重要的。

本书总是尽量给出几个选择，而不会强烈推荐某个特定选项，而这里是少数几个例外之一。目前来看，管理兼容性未来变化的最佳方法，就是正确使用语义化版本（Semantic Versioning semver）的版本号。它是一个广为接受的标准，用仅包含3个数字的版本标识符来标记代码的变化范围。它还给出了如何处理弃用的方法建议。下面是摘录semver官网的摘要。

版本格式：主版本号．次版本号．修订号，版本号递增规则如下。

• 主版本号（MAJOR）：当你做了不兼容的API修改。

• 次版本号（MINOR）：当你做了向后兼容的功能性新增。

• 修订号（PATCH）：当你做了向后兼容的问题修正。

先行版本号及版本编译信息可以加到“主版本号．次版本号．修订号”的后面，作为延伸。

测试时就会发现一个悲伤的事实，为了保证代码与每个依赖版本和每个环境（这里环境指的是Python版本）都保持兼容，必须在所有可能的组合中对代码进行测试。当然，如果项目的依赖很多，做到这一点基本是不可能的，因为随着依赖版本数目的增加，组合的数目也会迅速增加。因此，通常需要做一些权衡，使得运行所有兼容性测试无需花费数年的时间。第10章中介绍一般的测试，里面也介绍了所谓的矩阵测试中工具的选择。

项目遵循semver的好处在于，通常只有主版本才需要测试，因为次版本和修订版本中保证没有向后不兼容的变化。只有项目不违背这样的约定，这种说法才能成立。不幸的是，每个人都会犯错，许多项目中都出现了后向不兼容的变化，甚至在修订版本中也出现了这种变化。尽管如此，由于semver声称对次版本和修订版本的变化保持严格的向后兼容，那么打破这个规则就可以视为bug，可以在修订版本中进行修复。

如果明确定义了兼容范围并严格测试，那么实现兼容层就是最后一步，也是最不重要的一步。但是，每一位对这个话题感兴趣的程序员都应该知道下列工具和技术。

最基本的就是Python的__future__模块。它将Python新版本中的一些功能反向迁移到旧版本中，采用的是导入语句的形式：

          from __future__ import <feature>

future语句提供的功能是和语法相关的元素，其他方法很难处理这些元素。这个语句只能影响它所在的模块。下面是Python 2.7交互式会话的实例，从Python 3.0中引入Unicode：

        Python 2.7.10 (default, May 232015, 09:40:32) [MSC v.1500 32 bit
        (Intel)] on win32
        Type "help", "copyright", "credits" or "license" for more
        information.
        >>> type("foo")  # 旧的字面值
        <type 'str'>
        >>> from __future__ import unicode_literals
        >>> type("foo")  # 现在变成了unicode
        <type 'unicode'>

下面列出了所有可用的__future__语句，关注2/3兼容性的开发者都应该知道。

• division:Python 3新增的除法运算符（PEP 238）。

• absolute_import：将所有不以点字符开头的import语句格式解释为绝对导入（PEP 328）。

• print_function：将print语句变为函数调用，所以在print后面必须加括号（PEP 3112）。

• unicode_literals：将每个字符串解释为Unicode（PEP 3112）。

__future__中的可选语句列表很短，只包含几个语法功能。对于其他变化的内容，例如元类语法（第3章会讲到这一高级特性），维持其兼容性则困难得多。future语句也无法完全解决多个标准库重组的问题。幸运的是，有些工具旨在提供一致可用的兼容层。最有名的就是Six模块，提供了常用的2/3兼容性的整个样板。另一个很有前途但名气稍逊的工具是future模块。

在某些情况下，开发人员可能不想在一些小型Python包里添加其他依赖项。通常的做法是将所有兼容性代码放在一个附加模块中，该模块通常命名为compat.py。下面是来自python-gmaps项目的compat模块实例：

          # -＊- coding: utf-8-＊-
          import sys
          if sys.version_info < (3, 0, 0):
              import urlparse  # noqa

              def is_string(s):
                  return isinstance(s, basestring)

          else:
              from urllib import parse as urlparse  # noqa

              def is_string(s):
                  return isinstance(s, str)

这样的compat.py模块十分常见，即使是利用Six保持2/3兼容性的项目也很常见，因为这种方法非常方便，用于保存在不同版本的依赖包之间保持兼容性的代码。

下载示例代码

你可以用自己的账号在Packt的官方网站下载本书的示例代码文件。如果你是在其他地方购买的本书，你可以访问Packt的官方网站并注册，文件会直接通过邮件发送给你。

下载代码文件的步骤如下。

• 用你的电子邮件地址和密码登录或注册我们的网站。

• 将鼠标指针悬停在顶部的SUPPORT选项卡上。

• 单击Code Downloads & Errata。

• 在Search框中输入本书的名字。

• 选择你要下载代码文件的书籍。

• 从下拉菜单中选择本书的购买途径。

• 单击Code Download。

文件下载完成后，请确保用下列软件的最新版本对文件夹进行解压或提取。

• 在Windows上用WinRAR或7-Zip。

• 在Mac上用Zipeg、iZip或UnRarX。

• 在Linux上用7-Zip或PeaZip。

本书的代码包也托管在GitHub，网址为https://github.com/PacktPublishing/Expert-Python-Programming_Second-Edition。在GitHub上还有大量图书和视频资源。去看一下吧！

本周热推：

算法（第4版）手把手教你学C语言从零开始学C语言算法图解 Unity3D高级编程：主程手记