写CUDA到底难在哪?

2025-06-22 06:10:20

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
男朋友说我穿衣服太开放,难道好身材不应该显示出来吗?

男朋友说我穿衣服太开放,难道好身材不应该显示出来吗?

上次爬华山遇上一对夫妻,女的30出头,男的明显大些,女士穿白...

2025-06-22
鱼缸过滤全天开着太耗电,关掉半天又容易水浑,有什么好办法?

鱼缸过滤全天开着太耗电,关掉半天又容易水浑,有什么好办法?

长100cm/高80cm,你没说宽是多少,我算你50cm宽,...

2025-06-22
江西通报救护车 800 公里收费 2.8 万「不合理,暂停医院转运服务」,该医院要承担怎样的法律责任?

江西通报救护车 800 公里收费 2.8 万「不合理,暂停医院转运服务」,该医院要承担怎样的法律责任?

这种转运叫做ECMO retrival(ECMO转运),专门...

2025-06-22
女生真正的完美身材是什么样子?

女生真正的完美身材是什么样子?

最近在想,女生所谓的“完美身材”到底是什么。 我以前以...

2025-06-22
MongoDB的缺点以及你为什么不使用MongoDB?

MongoDB的缺点以及你为什么不使用MongoDB?

我觉得反驳弃用的人没有想明白两个问题: 1、如何证明Mong...

2025-06-22