写CUDA到底难在哪?

2025-06-20 01:05:17

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
ant-design-vue 社区为什么不维护了?

ant-design-vue 社区为什么不维护了?

社区用爱发电很难,除非作者弄这个是爱好。 有其它业务是赚钱的...

2025-06-21
NAS的盘是否需要一次性买齐?

NAS的盘是否需要一次性买齐?

NAS硬盘16TB容量只有一种选择,没有其他,因为其他都是渣...

2025-06-21
数据分析人员需要掌握sql到什么程度?

数据分析人员需要掌握sql到什么程度?

这个问题,核心其实不是“SQL学多少”,而是“你用SQL要解...

2025-06-21
汉语是牺牲了什么,才成为世界最紧凑、最高效的语言?

汉语是牺牲了什么,才成为世界最紧凑、最高效的语言?

流传甚广的联合国宪章最薄我没看过,但今天看了一个联合国决议,...

2025-06-21
程序员如何用好 Cursor 工具?

程序员如何用好 Cursor 工具?

最近尝试利用 Cursor 来重构一个规模较大的前端项目代码...

2025-06-21