从前我们经常玩找茬游戏,我们用肉眼还是比较容易找出图片中的不同,那在电脑上,计算机是如何分辨两个图片是否相同的呢?下面根据自己的理解来分析一下它的实现过程。
在网上查找资料找到了“图片指纹”这个名词,它的大致意思就是将一个图片的像素点用十六进制的形式来
表示,再根据这种表示形式来比较图片的相似程度。
那该如何计算一张图片的“指纹”呢?
计算“图片指纹”大致需要5个步骤。
1缩放尺寸,将图片规格化。图片的大小可能不同,那它们的尺寸就有可能对计算结果造成影响,所以先将
它们缩放成我们自己规定的大小,这样比较起来也会比较方便。
2简化色彩。我们现在要比较的实际上是图片的像素,那不同的色彩以及明亮度同样会对结果造成影响,所以
我们要简化它的色彩。
3计算图片的像素平均值。这一步主要是为了下面步骤。
4比较像素的灰度值与平均值,如果大于平均值,记为1,否则为0。
5算出“指纹”。
下面是实现代码:
/** * 生成图片指纹 * @param filename 文件名 * @return 图片指纹 */ public static String produceFingerPrint(String filename) { BufferedImage source = ImageHelper.readPNGImage(filename);// 读取文件 int width = 8; int height = 8; // 第一步,缩小尺寸。 // 将图片缩小到8x8的尺寸,总共64个像素。这一步的作用是去除图片的细节,只保留结构、明暗等基本信息,摒弃不同尺寸、比例带来的图片差异。 BufferedImage thumb = ImageHelper.thumb(source, width, height, false); // 第二步,简化色彩。 // 将缩小后的图片,转为64级灰度。也就是说,所有像素点总共只有64种颜色。 int[] pixels = new int[width * height]; for (int i = 0; i < width; i++) { for (int j = 0; j < height; j++) { pixels[i * height + j] = ImageHelper.rgbToGray(thumb.getRGB(i, j)); } } // 第三步,计算平均值。 // 计算所有64个像素的灰度平均值。 int avgPixel = ImageHelper.average(pixels); // 第四步,比较像素的灰度。 // 将每个像素的灰度,与平均值进行比较。大于或等于平均值,记为1;小于平均值,记为0。 int[] comps = new int[width * height]; for (int i = 0; i < comps.length; i++) { if (pixels[i] >= avgPixel) { comps[i] = 1; } else { comps[i] = 0; } } // 第五步,计算哈希值。 // 将上一步的比较结果,组合在一起,就构成了一个64位的整数,这就是这张图片的指纹。组合的次序并不重要,只要保证所有图片都采用同样次序就行了。 StringBuffer hashCode = new StringBuffer(); for (int i = 0; i < comps.length; i+= 4) { int result = comps[i] * (int) Math.pow(2, 3) + comps[i + 1] * (int) Math.pow(2, 2) + comps[i + 2] * (int) Math.pow(2, 1) + comps[i + 3]; hashCode.append(binaryToHex(result)); } // 得到指纹以后,就可以对比不同的图片,看看64位中有多少位是不一样的。 return hashCode.toString(); }
然后是将要比较的图片与原图片进行比较,如果“图片指纹”相差到一定程度,则认为两张图片是不同的,否
则相同。
/** * 计算"距离"。 * 如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。 * @param sourceHashCode 源hashCode * @param hashCode 与之比较的hashCode */ public static int hammingDistance(String sourceHashCode, String hashCode) { int difference = 0; int len = sourceHashCode.length(); for (int i = 0; i < len; i++) { if (sourceHashCode.charAt(i) != hashCode.charAt(i)) { difference ++; } } return difference; } 下面是ImageHelper中的一些方法: /** * 读取JPEG图片 * @param filename 文件名 * @return BufferedImage 图片对象 */ public static BufferedImage readPNGImage(String filename) { try { File inputFile = new File(filename); BufferedImage sourceImage = ImageIO.read(inputFile); return sourceImage; } catch (FileNotFoundException e) { e.printStackTrace(); } catch (ImageFormatException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } return null; } /** * 灰度值计算 * @param pixels 像素 * @return int 灰度值 */ public static int rgbToGray(int pixels) { // int _alpha = (pixels >> 24) & 0xFF; int _red = (pixels >> 16) & 0xFF; int _green = (pixels >> 8) & 0xFF; int _blue = (pixels) & 0xFF; return (int) (0.3 * _red + 0.59 * _green + 0.11 * _blue); } /** * 计算数组的平均值 * @param pixels 数组 * @return int 平均值 */ public static int average(int[] pixels) { float m = 0; for (int i = 0; i < pixels.length; ++i) { m += pixels[i]; } m = m / pixels.length; return (int) m; }
这样比较出来的图片是有一定局限的,对于两张只有大小,明亮程度有差别的图片它才会认为是相同的,而
对于两张只有一小部分有文字之外,其他都相同的图片,它会认为不同。但如果我们对其中的参数进行改变的话还是可以使它有所改进的。但那样的话或许会导致匹配的精度下降甚至出现错误,但我们还是能用这种方法做一个自动帮你找茬的这样一个工具的。