7.2.1 类的定义

利用 OOP 来解决问题时,首要任务是确定该问题涉及哪些对象,每种对象分别具有什 么数据和操作。类就是对这些信息的表达。类的创建,体现了面向对象的诸多思想和方法, 本节对此进行详细介绍。

抽象

人们在认识客观世界时,经常采用抽象方法来对客观世界的众多事物进行归纳、分类。 抽象就是忽略事物中与当前目标无关的、非本质的特征,而抽取与当前目标有关的、本质的特征。经过抽象,能够确认事物间的共性,并将具有共性的事物归入一类,从而得到一个抽 象概念。抽象时需要考虑“当前目标”,对于某个事物,根据不同的解题目标,可以进行不同 的抽象。

抽象是面向对象的基本方法,而抽象的工具就是“类”。我们用类来抽象、描述待求解 问题所涉及的事物,具体包括两个方面的抽象:数据抽象和行为抽象。数据抽象描述某类对 象共有的属性或状态,行为抽象描述某类对象共有的行为或功能特征。

例如,对学校里一个个具体的学生张三、李四、王五等进行概括,可以抽取出学号、姓 名等数据属性,还可以抽取出选课、做项目、加入学生社团等行为属性,从而建立“学生类”。 又如,对马路上形形色色的汽车进行概括,可以抽取出制造商、型号、排量等数据属性,还 可以抽取出启动、刹车、加速等行为属性,从而建立“汽车类”。

抽象可以是在多个层次上进行的。例如,当抽象出学生、教师、职工等类别之后,可以 从他们进一步抽象出“师生员工”类;当建立了汽车、火车、飞机等类别之后,可以从他们 进一步抽象出“交通工具”类。如此进行,最终可以形成一个抽象层次,称为类层次。这种 抽象方法在各学科中都是常用的,最典型的如生物学中的分类层次:

智人 → 人科 → 灵长目 → 哺乳纲 → 脊索动物门 → 动物界

封装

在日常生活中,人们使用着各种提供特定服务的设备,如汽车、彩电等等。对于这些设备,人们通常只需了解它们的功能,而不关心它们的内部是怎样工作的。类似地,计算机程 序也是提供特定服务的“设备”,我们使用程序时通常也只关心程序的功能,而不关心程序内 部的实现过程。OOP 中的封装概念正是这种思想的体现。

封装(encapsulation)是指用类将对象的数据和操作结合成一个封闭的程序单元,并对 外部隐藏内部实现细节。隐藏信息包含两重意思:一是用户无需了解隐藏的信息就能使用该 类,二是不允许用户直接操作类中被隐藏的信息。

封装导致外界不能直接存取对象的数据,但这并不是说我们就无法处理对象数据了。与 数据封装在一起的还有对数据的操作(称为方法的一些函数),类会对外公开这些方法的名称 和调用格式,亦即提供了与外界的交互界面。外界可以向对象发消息(所请求的方法名称及 参数),然后对象通过执行方法来响应外界的消息。所以,外界可通过消息机制来间接处理对 象数据。当然,外界只能按对象允许的方式来处理对象数据,因为对象能够响应的消息是由 类定义决定的。

封装对类的实现者和使用者都有好处。第一,防止使用者直接操作对象数据时有意无意 造成的错误,毕竟对象自己的方法处理自己的数据才是安全的;第二,使用者通过方法调用 来操作数据时无需了解内部实现细节,类的功能非常易用;第三,即使实现者以后修改了类 的内部实现,只要不改变方法界面,使用者就不会受到任何影响,这使得程序非常容易维护; 第四,可以使同类甚至不同类的对象对使用者都呈现标准化的操作界面。以电视机为例可以 很清楚地看出上述优点。电视机将内部各种器件封装起来,使用户只能通过面板上的按键来 操作电视机,这样既保护了内部器件使之不易被用户损坏,又使电视机简单易用;电视机内 部器件的维修和升级对用户来说没有任何影响;所有品牌的电视机几乎都提供标准化的面板(电源开关、频道切换、音量调节等),只要会使用一种电视机,基本上就会使用其他任何电 视机甚至收音机(因为收音机界面也是类似的调换频道、调节音量等)。

Python 类定义

如前所述,类是用来刻划对象的数据特性和行为特性的。Python 中类定义形如:

class <类名>:
    <方法定义 1>:
        ...
    <方法定义 n>:

其中诸“方法定义”就是对对象的操作行为的定义,外界能够请求对象所做的事情完全由这 些方法决定。

每个方法定义其实都是一个函数定义,即形如:

def <方法名>(<参数>):
    ...

方法与普通函数略有差别。首先,每个方法都必须有一个特殊的形参 self,并且 self 必 须是该方法的第一个形参(如果还有其他参数的话)。至于这个特殊参数的作用,我们在稍后 介绍方法调用的时候再解释。其次,方法只能通过对象来调用,即向对象发消息请求对象执 行某个方法。

至此,读者也许会有疑问:不是说类中包含了数据和操作的定义吗,怎么上述类定义形 式中只有操作没有数据?在 Python 中,类的实例所拥有的数据一般在类的方法中定义的,尤 其是在一个特殊方法 init方法①中。这里的方法名 init是 Python 规定的,通常每个类 都会定义 init__方法,其功能将在介绍类实例创建时进行解释。

作为例子,我们来定义类 Person。Person 是对现实世界中“人”的抽象,每个人都有自 己的姓名和出生年份,并且都能回答外界有关其姓名和年龄的提问。我们将 Person 类的定义 保存在文件 person.py 中,将来任何程序都可以通过导入此文件而使用 Person 类。

【程序 7.3】person.py

class Person:
    def __init__ (self,n,y): 
        self.name = n self.year = y
    def whatName(self):
        print "My name is",self.name 
    def howOld(self,y):
        age = y – self.year 
        if age > 0:
            print "My age in",y,"is",age 
        else:
            print "I was born in",self.year

Person 对象的数据就是在 init__方法中定义的 self.name 和 self.year,Person 对象能够执 行的操作就是方法 whatName()和 howOld()。

像 Person 类中的 self.name 和 self.year 这样,以“self.<变量名>”形式定义的变量称为实 例变量(instance variable),意思是这种数据是属于类的实例的,不同实例可有不同的值。实 例变量可以在类的任何方法中定义(通常在 init中定义),也可以在类的任何方法中直接 引用。Person 类中,self.name 和 self.year 是实例变量,将来创建的每一个 Person 实例都拥有 这两个数据,每个实例各自的姓名和出生年份的值可以是不同的;另外,这两个实例变量虽 然是在 init中定义,但在 whatName 和 howOld 方法中都可以直接引用。注意,如果方法 中定义的某个变量名前没有 self 前缀,则该变量是普通的函数局部变量,其作用域仅限于该方法。例如上例中在 howOld 方法中定义的 age 就是局部变量,它只能在 howOld 中引用。 类的方法定义中可以通过 self.f()的方式调用同一个类中的其它方法 f。例如:

① 注意,这个名称中 init 前后各是两个下划线字符!Python 常用这种形式的标识符来命名内部对象。

class Person1:
    def __init__ (self,n,y): 
        self.name = n 
        self.year = y
    def whatName(self):
        print "My name is",self.name 
    def howOld(self,y):
        age = y – self.year 
        if age > 0:
            print "My age in",y,"is",age 
        else:
            print "I was born in",self.year 
    def allInfo(self,y):
        self.whatName() 
        self.howOld(y)

其中的方法 allInfo 调用了本类中的另外两个方法 whatName 和 howOld。

类实际上是用户自定义的数据类型,是对 Python 语言本身提供的基本数据类型的扩充。 一旦定义了类,就可以将它当作 Python 标准数据类型来使用。

作为特例,如果某种对象只包含一些数据,不包含对数据的操作,则可以在类中只定义 实例变量而不定义操作方法(除了特殊的 init 方法)。这样的类相当于很多编程语言中的 “结构”类型①,其作用是将一些数据项组合成一个整体。事实上,类可以看作是传统结构 类型的发展,即类是添加了数据操作的“结构”。

最后说一下命名问题。面向对象编程中习惯上使用大写字母开头的标识符来为类命名(如 Person),而类中方法和实例变量则惯常使用小写字母开头的标识符来命名(如 name、year 和 whatName)。方法名如果由多个单词构成,一般采用骆驼式命名法,即除第一个单词之外 的各单词首字母大写,如 whatName 和 howOld。