图片匹配

从前我们经常玩找茬游戏，我们用肉眼还是比较容易找出图片中的不同，那在电脑上，计算机是如何分辨两个图片是否相同的呢？下面根据自己的理解来分析一下它的实现过程。

在网上查找资料找到了“图片指纹”这个名词，它的大致意思就是将一个图片的像素点用十六进制的形式来

表示，再根据这种表示形式来比较图片的相似程度。

那该如何计算一张图片的“指纹”呢？

计算“图片指纹”大致需要5个步骤。

1缩放尺寸，将图片规格化。图片的大小可能不同，那它们的尺寸就有可能对计算结果造成影响，所以先将

它们缩放成我们自己规定的大小，这样比较起来也会比较方便。

2简化色彩。我们现在要比较的实际上是图片的像素，那不同的色彩以及明亮度同样会对结果造成影响，所以

我们要简化它的色彩。

3计算图片的像素平均值。这一步主要是为了下面步骤。

4比较像素的灰度值与平均值，如果大于平均值，记为1，否则为0。

5算出“指纹”。

下面是实现代码：

/**
	 * 生成图片指纹
	 * @param filename 文件名
	 * @return 图片指纹
	 */
	public static String produceFingerPrint(String filename) {
		BufferedImage source = ImageHelper.readPNGImage(filename);// 读取文件

		int width = 8;
		int height = 8;
		
		// 第一步，缩小尺寸。
		// 将图片缩小到8x8的尺寸，总共64个像素。这一步的作用是去除图片的细节，只保留结构、明暗等基本信息，摒弃不同尺寸、比例带来的图片差异。
		BufferedImage thumb = ImageHelper.thumb(source, width, height, false);
		
		// 第二步，简化色彩。
		// 将缩小后的图片，转为64级灰度。也就是说，所有像素点总共只有64种颜色。
		int[] pixels = new int[width * height];
		for (int i = 0; i < width; i++) {
			for (int j = 0; j < height; j++) {
				pixels[i * height + j] = ImageHelper.rgbToGray(thumb.getRGB(i, j));
			}
		}
		
		// 第三步，计算平均值。
		// 计算所有64个像素的灰度平均值。
		int avgPixel = ImageHelper.average(pixels);
		
		// 第四步，比较像素的灰度。
		// 将每个像素的灰度，与平均值进行比较。大于或等于平均值，记为1；小于平均值，记为0。
		int[] comps = new int[width * height];
		for (int i = 0; i < comps.length; i++) {
			if (pixels[i] >= avgPixel) {
				comps[i] = 1;
			} else {
				comps[i] = 0;
			}
		}
		
		// 第五步，计算哈希值。
		// 将上一步的比较结果，组合在一起，就构成了一个64位的整数，这就是这张图片的指纹。组合的次序并不重要，只要保证所有图片都采用同样次序就行了。
		StringBuffer hashCode = new StringBuffer();
		for (int i = 0; i < comps.length; i+= 4) {
			int result = comps[i] * (int) Math.pow(2, 3) + comps[i + 1] * (int) Math.pow(2, 2) + comps[i + 2] * (int) Math.pow(2, 1) + comps[i + 3];
			hashCode.append(binaryToHex(result));
		}
		// 得到指纹以后，就可以对比不同的图片，看看64位中有多少位是不一样的。
		return hashCode.toString();
	}

然后是将要比较的图片与原图片进行比较，如果“图片指纹”相差到一定程度，则认为两张图片是不同的，否

则相同。

/**
	 * 计算"距离"。
	 * 如果不相同的数据位不超过5，就说明两张图片很相似；如果大于10，就说明这是两张不同的图片。
	 * @param sourceHashCode 源hashCode
	 * @param hashCode 与之比较的hashCode
	 */
	public static int hammingDistance(String sourceHashCode, String hashCode) {
		int difference = 0;
		int len = sourceHashCode.length();
		
		for (int i = 0; i < len; i++) {
			if (sourceHashCode.charAt(i) != hashCode.charAt(i)) {
				difference ++;
			} 
		}
		return difference;
	}
	
	下面是ImageHelper中的一些方法：
	
	/**
	 * 读取JPEG图片
	 * @param filename 文件名
	 * @return BufferedImage 图片对象
	 */
	public static BufferedImage readPNGImage(String filename)
	{
		try {
			File inputFile = new File(filename);  
	        BufferedImage sourceImage = ImageIO.read(inputFile);
			return sourceImage;
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (ImageFormatException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
		return null;
	}
	
	/**
	 * 灰度值计算
	 * @param pixels 像素
	 * @return int 灰度值
	 */
	public static int rgbToGray(int pixels) {
		// int _alpha = (pixels >> 24) & 0xFF;
		int _red = (pixels >> 16) & 0xFF;
		int _green = (pixels >> 8) & 0xFF;
		int _blue = (pixels) & 0xFF;
		return (int) (0.3 * _red + 0.59 * _green + 0.11 * _blue);
	}
	
	/**
	 * 计算数组的平均值
	 * @param pixels 数组
	 * @return int 平均值
	 */
	public static int average(int[] pixels) {
		float m = 0;
		for (int i = 0; i < pixels.length; ++i) {
			m += pixels[i];
		}
		m = m / pixels.length;
		return (int) m;
	}

这样比较出来的图片是有一定局限的，对于两张只有大小，明亮程度有差别的图片它才会认为是相同的，而

对于两张只有一小部分有文字之外，其他都相同的图片，它会认为不同。但如果我们对其中的参数进行改变的话还是可以使它有所改进的。但那样的话或许会导致匹配的精度下降甚至出现错误，但我们还是能用这种方法做一个自动帮你找茬的这样一个工具的。

猜你喜欢