我的SSE图像优化算法1.图像取反 - 代码天地

我的SSE图像优化算法1.图像取反

业界资讯 2020-07-25 10:31:12 阅读次数: 0

SSE指令一次性能同时处理128位即16个字节型数据，8个short类型的，或者4个int类型数据(128=16×8=8×2×8=4×4×8)
一个字节=8位=255。
取反是对灰度图像取反，所以默认一个像素是一个字节，(如果是彩色24位的图像，24位=3个字节，(5×3+1)×8=128,128位包含5+1/3个像素信息,具体处理办法下篇文章再谈）。SSE代码部分能同时处理16个像素，从上到下，从左到右依次处理，每行余下的不能被16整除的像素则由C++代码进行处理。
以下分别是SSE代码和C++代码：

void IM_Invert_SSE(cv::Mat InImg, cv::Mat& OutImg)
{
	unsigned char *Src= InImg.data;
	unsigned char *Dst = OutImg.data;
	int Width = InImg.cols;
	int Height = InImg.rows;
	const int BlockSize = 16;
	int Block = Width / BlockSize;
	for (int Y = 0; Y < Height; Y++)
	{
		unsigned char *LinePS = Src + Y * Width;
		unsigned char *LinePD = Dst + Y * Width;
		for (int X = 0; X < Block * BlockSize; X += BlockSize, LinePS += BlockSize, LinePD += BlockSize)
		{
			__m128i Src, Result;
			Src = _mm_loadu_si128((__m128i *)(LinePS + 0));
			Result = _mm_andnot_si128(Src, _mm_set1_epi8(255));
			_mm_storeu_si128((__m128i*)(LinePD), Result);
		}
		for (int X = Block * BlockSize; X < Width; X++, LinePS ++, LinePD++)
		{
			LinePD[0] = 255- LinePS[0];
		}
	}
}
void IM_Invert(cv::Mat InImg, cv::Mat& OutImg)
{
	unsigned char *Src = InImg.data;
	unsigned char *Dst = OutImg.data;
	int Width = InImg.cols;
	int Height = InImg.rows;
	const int BlockSize = 16;
	int Block = Width / BlockSize;
	for (int Y = 0; Y < Height; Y++)
	{
		unsigned char *LinePS = Src + Y * Width;
		unsigned char *LinePD = Dst + Y * Width;
		for (int X = 0; X < Width; X++, LinePS++, LinePD++)
		{
			LinePD[0] = 255 - LinePS[0];
		}
	}
}

这里选用犬子2160×2160的照片作为实验图像
原图：
在这里插入图片描述
灰度图这里就不放了（无意打开，有怪莫怪，但愿人没事，奠奠奠）。
灰度图二值化后：

取反后的图：

实验结果：
如图可见在64位debug模式下，SSE优化后，对于2160×2160的图，取反的速度比纯C++代码快了5倍多。

猜你喜欢

转载自blog.csdn.net/weixin_44302212/article/details/107560104

我的SSE图像优化算法1.图像取反

我的SSE图像优化算法2.图像二值化

SSE图像算法优化系列十：简单的一个肤色检测算法的SSE优化。

图像取反

SSE图像算法优化系列十八：三次卷积插值的进一步SSE优化。

SSE图像算法优化系列二十四: 基于形态学的图像后期抗锯齿算法--MLAA优化研究。

SSE图像算法优化系列三十：GIMP中的Noise Reduction算法原理及快速实现。

SSE图像算法优化系列二十三: 基于value-and-criterion structure 系列滤波器（如Kuwahara，MLV，MCV滤波器）的优化。 SSE图像算法优化系列十四：局部均方差及局部平方差算法的优化 SSE图像算法优化系列七：基于SSE实现的极速的矩形核腐蚀和膨胀（最大值和最小值）算法

SSE图像算法优化系列十九：一种局部Gamma校正对比度增强算法及其SSE优化。

超越halcon速度的二值图像的腐蚀和膨胀，实现目前最快的半径相关类算法（附核心源码）。 SSE图像算法优化系列七：基于SSE实现的极速的矩形核腐蚀和膨胀（最大值和最小值）算法 SSE图像算法优化系列十三：超高速BoxBlur算法的实现和优化（Opencv的速度的五倍） SSE图像算法优化系列二十五:二值图像的Euclidean distance map（EDM)特征图计算及其优化

图像像素取反

SSE图像算法优化系列二十二：优化龚元浩博士的曲率滤波算法，达到约500 MPixels/Sec的单次迭代速度 SSE图像算法优化系列四：图像转置的SSE优化（支持8位、24位、32位），提速4-6倍 SSE图像算法优化系列九：灵活运用SIMD指令16倍提升Sobel边缘检测的速度（4000*3000的24位图像时间由480ms降低到30ms）

SSE图像算法优化系列二十：一种快速简单而又有效的低照度图像恢复算法。 SSE图像算法优化系列十五：YUV/XYZ和RGB空间相互转化的极速实现(此后老板不用再担心算法转到其他空间通道的耗时了) SSE图像算法优化系列十九：一种局部Gamma校正对比度增强算法及其SSE优化

图像入门——1. 图像与数字图像介绍

SSE图像算法优化系列二十五:二值图像的Euclidean distance map（EDM)特征图计算及其优化。 SSE图像算法优化系列九：灵活运用SIMD指令16倍提升Sobel边缘检测的速度（4000*3000的24位图像时间由480ms降低到30ms）

图像处理：图像分类算法优化技巧

SSE图像算法优化系列二十六:和时间赛跑之优化高斯金字塔建立的计算过程。

SSE图像算法优化系列二十八：深度优化局部拉普拉斯金字塔滤波器。

1.图像，视频的加载，保存

openCV - 1. 加载、修改、保存图像

图像分类算法优化技巧图像分类算法优化技巧

图像分类算法的优化技巧

图像分类算法优化技巧

SSE图像算法优化系列二十九：基础的拉普拉斯金字塔融合用于改善图像增强中易出现的过增强问题（一）

SSE图像算法优化系列二十一：基于DCT变换图像去噪算法的进一步优化（100W像素30ms）。优化IPOL网站中基于DCT（离散余弦变换）的图像去噪算法（附源代码）

【HTML5 绘图与动画】使用图像 1.导入图像 2.缩放图像 3.裁切图像

暗通道算法优化雾气图像和夜间图像

图像优化

基于OpenCV的车牌识别(1. 车牌图像识别)

OpenCV-Python Tutorials - 2. 1. 图像入门

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

更多

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)