GpuDriven中的alignment - 代码天地

GpuDriven中的alignment

编程语言 2020-02-13 08:40:16 阅读次数: 0

最近在实现gpu driven的事情，在alignment和padding上面踩了一些坑；
先说结论，如果是想尽量少踩坑，在设计数据结构时候都保证是能pad到16byte（float4）倍数的会让问题少非常多。

这里罗列几个要点，有一些并没有明显的文档（可能有，但是常规文档中没看到）

gpu中读资源时候强制做了align操作，导致非16byte 的数据会出现错误

struct InstData
{
vec4 pos;
vec3 scale;
};
//使用InstData的const buffer，在每个instance读取的时候，地址会align（16 byte），导致数据读取错误；
//这样会好:
struct InstData
{
vec4 pos;
vec3 scale;
float padding;
};

注意c++和shader中的不同类的padding差异：如下数据如果gpu中读cpu的InstData类，数据就会因为padding出现错位

//cpp：
struct InstData
{
	u64 a;
	u32 b;
}

//gpu:
struct InstData
{
	UINT3 a;
}

3， structued buffer的非16byte align会导致数据跨cache line，导致performance降低：
https://developer.nvidia.com/content/understanding-structured-buffer-performance

安柏霖博客专家

发布了780 篇原创文章 · 获赞 460 · 访问量 165万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/ccanan/article/details/104288333

GpuDriven中的alignment

Alignment

目标检测中的Feature Alignment问题

Flutter中的Alignment是怎么回事？

face alignment中opencv读取pts文件并修改系列程序

Face alignment

C - Alignment

DNA Alignment

Vertical alignment

内存对齐（Memory Alignment）

UVA - 1593 Alignment of Code

face alignment dlib

# LIS # POJ 1836 Alignment

POJ1836-Alignment

Alignment POJ - 1836

Face alignment track

TextSpotter with Explicit Alignment and Attention

POJ 1836 Alignment

E - Alignment POJ - 1836

Alignment trap的问题

AAM Alignment 算法扩展

Alignment of Code (UVA - 1593 )

face alignment （人脸对齐）

what is 'linesize alignment' meaning?

Misplaced alignment tab character &

How to alignment by MAFFT

Image Alignment Toolbox

Flutter Alignment FractionalOffset AlignmentDirectional

AAM Alignment最后一篇：Robust AAM Alignment with Occlusion

POJ - 1836 Alignment （动态规划）

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)