2. Python 解释器

2.1 调用解释器

在可用的机器上,Python解释器通常安装成/usr/local/bin/python;请将/usr/local/bin放在您的Unix shell搜索路径,以使得可以通过在shell中键入命令

python

来启动它。由于解释器放置的目录是一个安装选项,其它地方也是可能的;请与您本地的Python专家或系统管理员联系。(例如,/usr/local/python是另外一个常见的位置。)

在Windows机器上,Python的安装通常放在C:\Python27,当然你可以在运行安装程序时进行更改。你可以在一个DOS窗口的命令提示符下键入以下命令来把这个目录添加到路径中:

set path=%path%;C:\python27

主提示符下键入文件结束字符(Unix上是Control-D、Windows上是Control-Z)会导致解释器以0退出状态退出。如果无法正常工作,您可以通过键入以下命令退出解释器:quit()。

解释器的行编辑功能通常不是很复杂。在Unix上,不管是谁安装的,解释器可能已启用对GNU readline库的支持,该库添加了更详细的交互式编辑和历史记录功能。检查是否支持命令行编辑的最快的方式也许是对你的第一个Python提示符键入Control-P。如果它发出蜂鸣声,则有命令行编辑;请参阅附录交互式输入编辑和历史替代的有关快捷键的介绍。如果什么都没发生,或者显示^P,则命令行编辑不可用;你就只能够使用退格键删除当前行中的字符。

解释器有些像Unix shell:当调用时使用连接到一个tty设备作为标准输入,它交互地读取并执行命令;当用文件名参数或文件作为标准输入调用,它将读取并执行该文件中的脚本

第二种启动解释器的方式是python-ccommand[arg]...,它会执行command中的语句,类似于shell的-c选项。因为Python语句经常包含空格或其他shell特殊字符,通常建议把全部command放在单引号里。

有些Python模块也是可执行的脚本。这些模块可以使用python-mmodule[arg]...直接调用,这和在命令行输入完整的路径名执行module的源文件是一样的。

有时使用一个脚本文件,能够在运行该脚本之后进入交互模式非常有用。这可以通过在脚本前面加上-i选项实现。

2.1.1. 参数传递

调用解释器时,脚本名称和其他参数被转换成一个字符串列表并赋值给sys模块中的argv变量。你可以通过importsys访问此列表。列表的长度是至少是1;如果没有给出脚本和参数,sys.argv[0]是一个空字符串。当使用-ccommand时,sys.argv[0]被设置为'-c'。当使用-mmodule时,sys.argv[0]被设定为指定模块的全名。-ccommand-mmodule后面的选项不会被Python解释器的选项处理机制解析,而是被保存在sys.argv中,供命令或模块使用。

2.1.2. 交互模式

当命令从tty读取时,就说解释器在交互模式下。这种模式下解释器以主提示符提示下一个命令,主提示符通常为三个大于号(>>>);对于续行解释器以从提示符提示,默认为三个点(...)。在第一个提示符之前,解释器会打印出一条欢迎信息声明它的版本号和授权公告:

python
Python 2.7 (#1, Feb 28 2010, 00:02:06)
Type "help", "copyright", "credits" or "license" for more information.
>>>

输入多行结构时需要续行。作为一个例子,看看这个if语句:

>>> the_world_is_flat = 1
>>> if the_world_is_flat:
...     print "Be careful not to fall off!"
...
Be careful not to fall off!

2.2. 解释器及其环境

2.2.1. 错误处理

错误发生时,解释器会打印错误信息和堆栈跟踪信息。在交互模式下,它会返回到主提示符;当输入来自一个文件,它会打印堆栈跟踪信息,然后以非零退出状态退出。(由try语句中的except子句处理的异常不是这方面的错误)。有些错误是致命的并导致非零状态退出;这通常由于内部不一致和某些情况下的内存不足导致。所有错误消息都写入标准错误流;执行命令的普通输出写入标准输出。

在主提示符或从提示符后输入中断符(通常为Control-C或DEL)可以取消输入,并返回到主提示符。[1]命令执行过程中输入中断符将引发KeyboardInterrupt异常,它可以被try语句截获。

2.2.2. 可执行的Python脚本

在类BSD的Unix系统上,可以将Python脚本变成可直接执行的,就像shell脚本一样,通过放置一行

#! /usr/bin/env python

(假定解释器在用户的PATH中)在脚本的开始并且给文件可执行的模式。#!必须是文件最开始的两个字符。在一些平台上,第一行必须以一个Unix风格的行结束符('\n')结束,不能是Windows的行结束符('\r\n')。注意,字符'#'在Python中用于起始一个注释。

通过chmod命令可以给予脚本可执行的模式或权限:

$ chmod +x myscript.py

在Windows系统上,没有"可执行模式"的概念。Python安装程序会自动将.py文件与python.exe关联,双击Python文件将以脚本的方式运行它。扩展名也可以是.pyw,在这种情况下,通常出现的控制台窗口不会再显示了。

2.2.3. 源程序的编码

在Python源文件中可以使用非ASCII编码。最好的方法是在#!行的后面再增加一行特殊的注释来定义源文件的编码:

# -*- coding: encoding -*-

通过此声明,源文件中的所有字符将被视为由encoding编码,并且可以直接写由选中的编码方式编码的Unicode字符串字面量。在Python库参考手册的codecs小节中,可以找到所有可能的编码方式列表。

例如,若要写入包含欧元货币符号的 Unicode 字面量,可以使用ISO-8859-15 编码,其欧元符号的值为164 。此脚本中,以 ISO-8859-15 编码,保存时将打印的值 8364 (Unicode 代码点相应的欧元符号),然后退出:

# -*- coding: iso-8859-15 -*-

currency = u"€"
print ord(currency)

如果你的编辑器支持保存为带有UTF-8字节顺序标记(也叫做BOM) 的UTF-8格式的文件,你可以使用这种功能而不用编码声明。IDLE如果设置了Options/General/Default Source Encoding/UTF-8 也支持此功能。注意,这种标记方法在旧的Python 版本中(2.2 及更早)是不能识别的,同样也不能被能够处理#!(只在Unix系统上使用)行的操作系统识别。

通过使用 UTF-8 编码(无论是BOM方式或者是编码声明方式),世界上大多数语言的字符可以在字符串字面量和注释中同时使用。在标识符中使用非 ASCII 字符是不支持的。若要正确显示所有这些字符,您的编辑器必须认识该文件是 UTF-8 编码,并且它必须使用支持文件中所有字符的字体。

2.2.4. 交互式启动文件

当您以交互方式使用Python时,让解释器在每次启动时执行一些标准命令会变得非常方便。你可以通过设置环境变量PYTHONSTARTUP为包含你的启动命令的文件的名字。这类似于Unix shell的.profile功能。

这个文件只会在交互式会话时读取,当 Python 从脚本中读取命令时不会读取,当/dev/tty 在命令中明确指明时也不会读取 (尽管这种方式很像是交互方式)。它和交互式命令在相同的命名空间中执行,所以在交互式会话中,由它定义或引用的一切可以在解释器中不受限制地使用。您还可以在此文件中更改sys.ps1和sys.ps2 的提示符。

如果您想要从当前目录读取额外的启动文件,你可以在全局启动文件中使用这样的代码 ifos.path.isfile('.pythonrc.py'):execfile('.pythonrc.py')。如果你想要在脚本中使用启动文件,必须要在脚本中明确地写出:

import os
filename = os.environ.get('PYTHONSTARTUP')
if filename and os.path.isfile(filename):
    execfile(filename)

2.2.5. 自定义模块

Python提供了两个钩子来定制化它:sitecustomize和usercustomize。要查看它如何工作,你首先需要找到你的用户site-packages目录。启动Python并运行下面的代码:

>>> import site
>>> site.getusersitepackages()
'/home/user/.local/lib/python2.7/site-packages'

现在你可以在此目录下创建名为usercustomize.py的文件,并把任何你想要的东西放在里面。它将影响每个Python调用,除非启动时用-s选项来禁用自动导入。

sitecustomize的工作方式相同,但通常是由计算机的管理员在全局site-packages目录中创建,并在usercustomize之前导入。更多详细信息请参阅site模块的文档。

脚注

| [1] | GNU Readline库的一个问题可能导致它不会发生。 | |-----|-----|