CUDA C编程向量加法-第3章 CUDA 简介

企业开发 2023-08-22 19:53:16 阅读次数: 0

第3章 CUDA 简介

《大规模并行处理器编程实战》学习，其他章节关注专栏 CUDA C

CUDA C 编程友情链接：

这章主要以向量加法 vector add 为切入点，讲述了如何把一个 c 语言向量加法代码改写为 cuda扩展的c语言向量加法。

1.1 传统向量加法

传统向量加法是通过循环实现的
在这里插入图片描述

1.2 CUDA 加法加速

cuda向量加法是通过多线程控制的cuda加法并行实现的，即同时打开n个线程，每个线程计算1个加法，则长度为n的向量被同步计算。使用CUDA扩展的程序，需要三个步骤：

先申请设备（device, cuda）的内存（memory），将数据从主机（host）复制到设备（device）
使用设备API 对申请到的内存进行操作。（设备上的操作是以kernel函数的形式进行的）
把计算结果复制回主机

加法函数的具体进行

在以多线程的形式对向量进行操作时，多个线程以线程块的方式存在。一个线程块中包含blockDim(例如256)个线程，每个线程执行相同的代码。
在这里插入图片描述

加法代码如下，其中threadIdx.x表示该线程在本线程块中的Index，即在第i个块中，该线程是第j个，0<=j<=blockDim-1。i的计算为该线程在所有块中的index，即i=本块index + 一个块blockDim个线程 * 第blockIdx线程块：
在这里插入图片描述

值得注意的是，在 CUDA 交叉编程环境中，默认代码是在主机 host 上执行，若要在设备上执行，则需要 global 修饰，具体如：
在这里插入图片描述

Kernel 函数参数

重看Kernel函数，配置参数在<<< >>>之间，分别表示

ceil(n/256.0) 需要 n/256 个线程块
256 每个线程块有 256 个子线程

猜你喜欢

转载自blog.csdn.net/qq_40491305/article/details/114528176

CUDA C编程向量加法-第3章 CUDA 简介

CUDA简介——编程模式

《CUDA By Example》【Chapter 03】CUDA C简介

CUDA简介

GPU 高性能编程 CUDA : CUDA C 简介

CUDA是什么-CUDA简介

CUDA简介——CUDA内存模式

CUDA编程（一）：GPU计算与CUDA编程简介

[CUDA] CUDA编程入门

CUDA（Ⅱ）：CUDA C入门

【CUDA并行程序设计系列（2）】CUDA简介及CUDA初步编程

cuda

[CUDA]CUDA C并行编程

CUDA简介——同步

CUDA之向量加法

CUDA编程

cuda 编程

CUDA编程之CUDA流

CUDA编程——树状加法

1. CUDA编程手册中文版---CUDA简介

CPU、GPU、CUDA，CuDNN 简介

CUDA学习笔记（1）——简介

CUDA简介——基本概念

CUDA简介——For循环并行化

CUDA C Programming Guide 笔记——1.简介

CUDA编程笔记（3）

CUDA C 编程指南

CUDA C编程记录

CUDA编程四（评估CUDA程序的好坏）

CUDA(八) 周斌 CUDA 编程三

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)