深度学习接触一段时间也慢慢有些东西要改一些了,基本的就是图像的操作。我前面的《图像目标分割》文档有个错误,就是关于imsave()的,说要乘以256,实际上应该是255。更准确的说,要根据类型看。例如:
import skimage.io
image_png = skimage.io.imread('/tmp/test_png.png')
image_new = rgba2rgb(image_png)
这里读入一个png格式的图片,png含有alpha通道,也就是rgba四通道。这里image_png变量里面是uint8类型的,所以通过rgba2rgb()方法转换就成了float64类型的了。所以才有了后面说的如果想达到读入jpg这种三通道,不经过转换的原始整数数据,需要乘以255的操作。
实际上这是因为涉及到了uint8和float64类型变化了,如果float类型用imsave()保存,需要数值在-1到1之间,否则会报错:
ValueError: Images of type float must be between -1 and 1.
如果一开始就是uint8,保存的时候就无需乘以255,如:
import numpy as np
import skimage.io
image = np.array(
[
[
[109, 232, 173],
[55, 35, 144]
],
[
[43, 124, 185],
[234, 127, 246]
]
], dtype=np.uint8)
skimage.io.imsave('/tmp/test.jpg', image)
这样是没有问题的。另外一点,imsave()保存可以是(M, N),(M, N, 3)或者(M, N, 4),也就是灰度图单通道,rgb和rgba都可以。我上例image的shape就是(2, 2, 3),也就是只有4个像素的三通道图像。