GPU并行编程方法
GPU并行编程方法 (2012-04-10 09:20:59)转载▼标签: 杂谈 编写利用GPU加速的并行程序有多种方法,归纳起来有三种:1. 利用现有的GPU函数库。Nvidia 的CUDA工具箱中提高了免费的GPU加速的快速傅里叶变换(FFT)、基本线性代数子程序(BLAST)、
标签:
杂谈 |
编写利用GPU加速的并行程序有多种方法,归纳起来有三种:
1.
Nvidia 的CUDA工具箱中提高了免费的GPU加速的快速傅里叶变换(FFT)、基本线性代数子程序(BLAST)、图像与视频处理库(NPP)。用户只要把源代码中CPU版本的快速傅里叶变换、快速傅里叶变换和图像与视频处理库替换成相应的GPU版,即可得到性能加速。除了Nvidia提供的函数库以外,第三方的GPU函数库有:
- CUDA数据并行基元库(cuDPP)
- CULA工具:由EM Photonics公司推出, CUDA GPU中的LAPACK
- MAGMA:由Dongarra’s Group推出,CUDA GPU和多核CPU中的LAPACK
- 雅可比预处理共轭梯度(JCG)
- GPULib:针对接口描述语言(IDL)以及矩阵实验室(MATLAB)的数学函数库
- GPU VSIPL信号处理库
- 计算机视觉(CV)以及成像库
- OpenCurrent: 规则网格系统中CUDA加速PDE(partial differential equation,偏微分方程)开源数据库解决方案
- CUDA / GPU中的libSVM
2.
这是最普遍、最适用的方法,使用CUDA可以最大限度地发挥GPU的加速性能。
3.
基于的OpenACC标准,GPU Directive编程是加快科学或工业的代码容易的、行之有效的方法。使用GPU指令,简单地在你的源码中插入编译指令,编译器会自动把计算密集型代码部分映射到到GPU的中去计算,从而加速你的代码。下面是一个简单的用一条指令如何可以加快计算圆周率的例子。使用GPU指令,你可以很快上手,并在当天看到的结果。
OpenACC编程的优点:
l
l
l
并行计算工具的领导者PGI、CAPS和Cray 将率先支持OpenACC。
昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链
更多推荐


所有评论(0)