2.6 使用Numpy和Scipy进行图像操作及处理

In [3]:

%matplotlib inline
import numpy as np

作者：Emmanuelle Gouillart, Gaël Varoquaux

这个部分解决用核心的科学模块NumPy和SciPy做基本的图像操作和处理。这个教程中涵盖的一些操作可能对于一些其他类型的多维度数据处理比对图像处理更加有用。特别是，子摸块scipy.ndimage提供了在N维Numpy数组上操作的方法。

也看一下: 对于更高级的图像处理和图像特有的程序，见专注于skimage模块教程Scikit-image: 图像处理。

图像 = 2-D 数值数组

(或者 3-D: CT, MRI, 2D + time; 4-D, ...)

这里, 图像 == Numpy 数组 np.array

本教程中使用的工具:

numpy: 基础的数组操作
scipy: scipy.ndimage 专注于图像处理的子模块 (n维图像)。见文档:

In [1]:

from scipy import ndimage

图像处理中的常见任务:

输入/输出、显示图像
基础操作: 剪切, 翻转、旋转...
图像过滤: 降噪, 锐化
图形分割: 根据不同的对象标记像素
分类
特征提取
配准
...

章节内容

打开和写入图像文件
显示图像
基础操作
    统计信息
    几何图像变换
图像过滤
    模糊/光滑
    锐化
    降噪
    数学形态学
特征提取
    边缘检测
    分隔
测量对象属性: ndimage.measurements

2.6.1 打开和写入图像文件

将数组写入文件:

In [4]:

from scipy import misc
f = misc.face()
misc.imsave('face.png', f) # 使用图像模块 (PIL)

import matplotlib.pyplot as plt
plt.imshow(f)
plt.show()

从图像文件创建一个numpy数组:

In [5]:

from scipy import misc
face = misc.face()
misc.imsave('face.png', face) # 首先我们需要创建这个PNG文件

face = misc.imread('face.png')
type(face)

Out[5]:

numpy.ndarray

In [6]:

face.shape, face.dtype

Out[6]:

((768, 1024, 3), dtype('uint8'))

对于8位的图像 (0-255) dtype是uint8

打开raw文件 (照相机, 3-D 图像)

In [7]:

face.tofile('face.raw') # 创建raw文件
face_from_raw = np.fromfile('face.raw', dtype=np.uint8)
face_from_raw.shape

Out[7]:

(2359296,)

In [8]:

face_from_raw.shape = (768, 1024, 3)

需要知道图像的shape和dtype (如何去分离数据类型)。

对于大数据, 使用np.memmap来做内存映射:

In [9]:

face_memmap = np.memmap('face.raw', dtype=np.uint8, shape=(768, 1024, 3))

(数据从文件中读取，并没有加载到内存)

处理一组图像文件

In [10]:

for i in range(10):
    im = np.random.random_integers(0, 255, 10000).reshape((100, 100))
    misc.imsave('random_%02d.png' % i, im)
from glob import glob
filelist = glob('random*.png')
filelist.sort()

2.6.2 显示图像

使用matplotlib和imshow在matplotlib图形内部显示图像:

In [11]:

f = misc.face(gray=True)  # 取回灰度图像
import matplotlib.pyplot as plt
plt.imshow(f, cmap=plt.cm.gray)

Out[11]:

<matplotlib.image.AxesImage at 0x10afb0bd0>

通过设置最小和最大值增加对比度:

In [14]:

plt.imshow(f, cmap=plt.cm.gray, vmin=30, vmax=200)

Out[14]:

<matplotlib.image.AxesImage at 0x110f8c6d0>

In [16]:

plt.imshow(f, cmap=plt.cm.gray, vmin=30, vmax=200)
# 删除座标轴和刻度
plt.axis('off')

Out[16]:

(-0.5, 1023.5, 767.5, -0.5)

画出轮廓线:

In [18]:

plt.imshow(f, cmap=plt.cm.gray, vmin=30, vmax=200)
# 删除座标轴和刻度
plt.axis('off')
plt.contour(f, [50, 200])

Out[18]:

<matplotlib.contour.QuadContourSet instance at 0x10cab5878>

[Python 源代码]

对于要精确检查的密度变量，使用interpolation='nearest':

In [19]:

plt.imshow(f[320:340, 510:530], cmap=plt.cm.gray)

Out[19]:

<matplotlib.image.AxesImage at 0x10590da90>

In [20]:

plt.imshow(f[320:340, 510:530], cmap=plt.cm.gray, interpolation='nearest')

Out[20]:

<matplotlib.image.AxesImage at 0x110716c10>

[Python 源代码]

也可以看一下 3-D 可视化: Mayavi

见使用Mayavi的3D绘图。

Image plane widgets
Isosurfaces
...

2.6.3 基础操作

图像是数组: 使用完整的numpy机制。

In [21]:

face = misc.face(gray=True)
face[0, 40]

Out[21]:

In [22]:

# 切片
face[10:13, 20:23]

Out[22]:

array([[141, 153, 145],
       [133, 134, 125],
       [ 96,  92,  94]], dtype=uint8)

In [24]:

face[100:120] = 255
lx, ly = face.shape
X, Y = np.ogrid[0:lx, 0:ly]
mask = (X - lx / 2) ** 2 + (Y - ly / 2) ** 2 > lx * ly / 4
# 掩码（masks）
face[mask] = 0
# 象征索引（Fancy indexing）
face[range(400), range(400)] = 255

2.6 使用Numpy和Scipy进行图像操作及处理

2.6.1 打开和写入图像文件

2.6.2 显示图像

2.6.3 基础操作

2.6.3.1 统计信息

2.6.3.2 几何图像变换

2.6.4 图像过滤

2.6.4.1 模糊 / 光滑

2.6.4.2 锐化

2.6.4.3 降噪

2.6.4.4 数学形态学

2.6.5.2 分割

2.6.6 测量对象属性: ndimage.measurements

2.6.6 测量对象属性: `ndimage.measurements`