7.1.3 类是类型概念的发展
如上所述,对象可以视为广义的数据,因此和普通数据一样属于某种数据类型。从图 7.3 可以看出,“人”和“电视机”就属于两种完全不同的对象类别,而 John 和 Mary 这两个“人” 对象则具有完全相同的数据构成和操作,只是各自的数据值不同。
用计算机解决问题时,首先需要明确问题中涉及哪些数据,并在程序中将这些数据用编 程语言提供的数据类型表示出来,然后再去考虑需要对这些数据执行何种操作。为了表示数 据,编程语言一般提供若干基本数据类型(如 Python 的 int、float、str 和 list 等类型),并为 这些基本类型提供相应的基本操作(如 Python 中对 int、float、str 和 list 都提供了+运算,尽 管含义不同)。
然而,实际问题中往往涉及很复杂的数据,不能用基本数据类型直接表示。为了表示复 杂数据,大体有两种办法:一种是将复杂数据分解成若干个简单数据项,以便每个数据项可 以用基本类型表示;另一种是由用户自定义新的数据类型,以便对复杂数据进行直接的、整 体的表示。例如,如果要表示一个学生的姓名,可以简单地用一个字符串数据表示;如果要 表示一个学生的年龄,可以简单地用一个整数数据表示。但如果要整体表示一个“学生”,包 括该学生的姓名、年龄、地址等信息,就没法用基本数据类型直接表示了。一种解决办法是 将整体的“学生”分解成姓名、年龄、地址等简单数据,并通过分别处理这些简单数据而达 到处理“学生”数据的目的。但这不是好办法,因为这种表示法丢失了数据的整体性,在维 护姓名、年龄、地址等数据间的联系时很麻烦。另一种解决办法是将学生整体视为一个数据 值,并为这种数据值定义新的数据类型(因为编程语言中没有现成的类型能够表示该数据)。
假设我们要为“学生”数据定义一个新的数据类型 S,那么 S 应该是由若干更简单的数 据项构成的(如学号、姓名等),我们称这些构成 S 的成员数据为 S 的属性。除了定义 S 类 型数据的属性,还需要定义能对 S 数据执行什么操作(如修改姓名或年龄、读取地址等)。 可以利用编程语言提供的基本类型和新类型定义机制来实现 S,例如用 str 类型表示姓名和学 号,用 int 类型表示年龄之类,用函数实现对 S 数据的操作。定义了 S,就好像为编程语言添 加了一个新的数据类型,应用程序就可以像使用整数、字符串等基本类型一样去使用 S。
图 7.4 复杂数据类型 S 是多个属性的组合体
在传统观点下,由于数据和操作被视为分离的,因此定义新数据类型时只需定义复杂数据是怎样构成的,例如将“学生”数据定义成学号、姓名、年龄、地址的组合体①。至于如 何操作这种复杂数据,则需要另行编写处理代码,例如写一个函数 update(s)来实现对 S 型数据的修改,写另一个函数 get(s)来实现对 S 型数据的读取等等。总之,数据类型 S 与对这种 类型的数据的操作 update()、get()等是分离的两件事情,设计也是分离的(如图 7.4 所示)。 顺便提一下,将一些数据组合起来构成更复杂的数据的过程是可以重复进行的,即组合体成 员本身可以是复杂数据,如图 7.4 中的属性 address 一样。而在面向对象观点下,数据与操作 是不可分离的,是同一实体(即对象)的两个侧面。因此,当用户为复杂数据定义新的数据 类型 T 时,必须同时描述 T 的值的构成以及对 T 型值的操作。这样,上面的“学生”类型 S 将被定义成如图 7.5 所示的样子:
① 这种组合体在不同编程语言中有不同术语,如 Pascal 语言的记录类型和 C 语言的结构类型。
图 7.5 复杂数据类型 S 是多个属性及操作的组合体
由此,我们从传统的数据类型概念发展出了“类”的概念。类(class)是广义的数据类型,能够定义复杂数据的特性,包括静态特性(即数据)和动态特性(即对数据的操作方法)。 正如传统类型 int 可视为由 3、525 等合法整数值组成的集合一样,类也规定了它的合法值的 形式和范围。类的值就是“对象”,也称为类的实例。例如图 7.5 中的类 S 的合法值就是每一 个学生。
早期编程语言在创建新类型方面比较弱,但随着数据类型概念的发展,现代编程语言大 多都提供了强大的自定义数据类型的语言构造。面向对象编程语言中的类定义机制使得自定 义数据类型的能力达到了比较完善的程度。