Learn CUDA Programming, published by Packt
学习CUDA编程
这是《学习CUDA编程》一书的代码仓库,由Packt出版社出版。
一本指导初学者了解GPU编程和使用CUDA 10.x及C/C++进行并行计算的入门书籍
这本书是关于什么的?
统一计算设备架构(CUDA)是NVIDIA的GPU计算平台和应用程序接口,旨在与C、C++和Python等编程语言配合使用。通过CUDA,你可以利用GPU的并行计算能力,在科学、医疗保健和深度学习等领域开发高性能计算应用。
这本书涵盖了以下精彩特性:
- 理解CUDA中的通用GPU操作和编程模式
- 揭示GPU编程与CPU编程之间的区别
- 分析GPU应用性能并实施优化策略
- 探索GPU编程、剖析和调试工具
- 掌握并行编程算法及其实现方式
- 扩展多GPU和多节点加速的应用程序
- 深入研究使用加速库、Python和OpenACC的GPU编程平台
- 通过GPU深入理解卷积神经网络(CNNs)和循环神经网络(RNNs)中的深度学习加速
如果你觉得这本书适合你,今天就获取你的副本吧!
指南和导航
所有代码都按章节组织在文件夹中。例如,第02章。
代码看起来如下所示:
#include<stdio.h>
#include<stdlib.h>
__global__ void print_from_gpu(void) {
printf("来自设备的问候世界!线程[%d,%d]\n", threadIdx.x, blockIdx.x);
}
你需要准备以下内容来阅读这本书: 这本面向初学者的书籍适合想要深入了解并行计算、加入高性能计算社群并构建现代应用的程序员。假设读者具备基本的C和C++编程经验。对于深度学习爱好者,本书还涵盖了Python交互、DL库以及性能估算的实际案例。
以下是运行书中所有代码文件(第1至10章)所需的软硬件列表。
软硬件需求列表
| 章节 | 必需软件 | 需求操作系统 |
|---|---|---|
| 全部 | CUDA Toolkit 9.x/10.x | Linux |
| 第8章 | Matlab(2010a以后版本) | Linux |
| 第9章 | PGI编译器18.x/19.x | Linux |
| 第10章 | NGC | Linux |
我们还提供了一个PDF文件,其中包含了书中使用的截图和图表的彩色图像。点击这里下载。
相关产品
《动手实践:基于OpenCV和CUDA的GPU加速计算机视觉》[Packt] [亚马逊]
认识作者
Jaegeun Han
目前在韩国NVIDIA担任解决方案架构师,拥有近9年工作经验,主要支持消费互联网公司的深度学习项目。在加入NVIDIA之前,他从事系统软件、并行计算开发以及医疗和外科机器人领域的应用开发,拥有首尔国立大学计算机科学硕士学位。
Bharatkumar Sharma
在印度信息技术研究所班加罗尔分校获得信息技术硕士学位,具有约10年的软件架构、分布式和并行计算领域研发经验。目前在NVIDIA任东南亚资深解决方案架构师。
建议和反馈
如果有任何反馈或建议,请点击此处填写表格。

