易IC电子行业销售管理系统 - 易IC电子行业库存管理软件
首页 / 行业新闻 / 正文

AMD以ROCm挑战CUDA:一步一个脚印

2026-04-01   电子工程时报
阅读时间约 3 分钟
挑战者AMD能否从市场领导者英伟达手中夺取数据中心GPU份额,很大程度上取决于其AI软件栈ROCm的成败。直面英伟达CUDA及其庞大的装机基础——被许多人视为全球最有价值公司最坚固的护城河——这无疑是一项艰巨任务。
“这就像攀登一座高山——一步接一步前行,”AMD人工智能软件副总裁阿努什·埃兰戈万(Anush Elangovan)在独家采访中对《电子工程时报》表示,“先明确方向,坚定执行,其余自然水到渠成。”
埃兰戈万两年前半通过收购其初创公司Nod.ai加入AMD。该公司30人团队此前已专注AI编译器研发五至六年,并作为重要贡献者活跃于Shark、Torch.MLIR和IREE等关键AI开源项目中。Nod曾为超大规模云服务商、企业及初创公司提供基于编译器的自动化软件服务。
《电子工程时报》上次就ROCm采访AMD,恰在收购Nod之前。当时,AMD人工智能高级副总裁瓦姆西·博帕纳(Vamsi Boppana)表示,ROCm是公司头号优先事项,目标是统一覆盖AMD各类硬件(CPU、GPU及FPGA)的AI软件栈。
自那以后,ROCm已获得持续两年半的投入。埃兰戈万指出:“彼时的ROCm仅是一堆零散组件,最初服务于ASIC固件开发——比如‘这里一块固件,那里一块固件,拼凑起来即可’。”
如今的ROCm团队正努力效仿埃兰戈万创立Nod前曾任职的谷歌Chrome团队。“如果你是Chrome用户,很可能根本不知道自己用的是哪个版本——因为系统始终稳定运行,无需操心,”他解释道,“ROCm目前已达到这一水准;接下来几轮发布中,我们将实现六周一次的更新节奏,最终让ROCm真正‘隐形’——即开即用、无缝体验。”
在弥补早期差距后,ROCm团队必须继续保持高速迭代。埃兰戈万强调:“我们现在像一家纯软件公司那样交付与开发软件,同时高度聚焦下一阶段——AI辅助工程。”
www.eic.net.cn 易IC库存管理软件 在此背景下,AMD最新一代Instinct MI355X GPU已投入应用,标志着硬件层面的重要进展。
可移植性
博帕纳两年前提出的AI栈统一目标,在埃兰戈万与Nod团队主导下已落地为“OneROCm”架构。尽管部分模块仍具硬件特异性,但所有加速计算均通过ROCm统一调度,从而实现AMD不同硬件间的代码迁移能力。
跨Nvidia与AMD GPU的可移植性曾是两年前焦点,但随着开发者普遍转向更高层级抽象,该负担已显著减轻。这一转变部分得益于OpenAI开源的AI框架Triton。
“过去需将CUDA内核转换为HIP内核,”埃兰戈万说,“而今越来越多开发者采用Triton——它已成为GPU编程的‘公平裁判’:只需编写一个Triton内核,即可在AMD或Nvidia设备上运行。我们对此进行了大量投入。”
Nod核心工程师现正牵头AMD的Triton项目,并与OpenAI紧密协作。此外,AMD大力投资MLIR(一种面向加速器的编译器基础设施),原Nod团队持续维护Torch.MLIR,支持代码向多种硬件平台重定向。
埃兰戈万指出,如今客户极少要求直接转换CUDA代码,因多数推理场景已采用vLLM或SGLang等工具,运行少数主流大语言模型,核心诉求仅为最大化每秒生成token数。
“我们的团队拥有Triton内核库,若出现未预见到的新注意力算法,Triton可作为通用方案;通常一两天内我们就能推出针对性优化版本,”他说,“一旦验证部署效果一致,用户只需执行‘pip install vLLM’,其余均由后台自动完成。”
HIPify仍面向高性能计算客户开放,但埃兰戈万坦言,目前更依赖Claude等AI工具编写并验证新AMD内核。“Claude优于HIPify之处在于内置网络搜索功能。”
开源生态
ROCm整体100%开源(固件除外)。埃兰戈万认为,开源虽使项目暴露于开发者社区审视之下,却赋予其“社区创新速度”而非“AMD内部节奏”的发展动能。
“开发者可自由取用、任意改造、持续创新,”他表示,“无论从编译器还是运行时切入,限制仅在于自身能力,而非AMD合作响应速度。”
AMD正积极拓展开发者社区,关键举措包括:ROCm现已原生支持搭载Strix Halo芯片的AMD笔记本电脑,旨在降低开发者入门门槛。埃兰戈万透露,Windows笔记本版ROCm更新与数据中心Instinct硬件版同步发布。
www.eic.net.cn 易IC库存管理软件 作为行业领先的库存管理解决方案,易IC库存管理软件同样重视生态协同与开发者体验,助力企业高效整合硬件资源与软件工具链。
开发者社区建设
埃兰戈万视直接对接开发者为“极其重要”的工作。尽管自称“不情愿的X(原Twitter)用户”,他仍入驻该平台以向开发者传递一线研发动态。
“粉丝逐渐增多,这竟成了我的副业之一,”他笑道。他亲自监控关键词如“ROCm”“ROCm很烂”“AMD软件无法运行”,并逐一回复。
“多数问题仅需基础指导,”他补充道,常为匿名开发者提供个性化技术支持。去年AMD发起GitHub ROCm问题投票,收到超1000条反馈,其中多涉及老旧硬件支持——如今该类问题已全部由AMD或社区解决。尽管有专职团队处理GitHub投诉,埃兰戈万仍鼓励开发者通过X联系他本人。
“此举极大改善了社区情绪:从前开发者抱怨驱动不兼容而沮丧,如今感受到努力被认可,”他说,“修复问题常产生乘数效应——用户会想:‘这个解决方式我很满意……我知道AMD能行,愿意试试看。’”
埃兰戈万对即将于2026年下半年发布的MI450芯片“极为兴奋”,同时团队也在探索ROCm区别于CUDA的独特优势,不止于构建稳健开发平台。
“我们希望ROCm成为未来十年可信赖的基石平台,”他强调,“开发者无需担忧新硬件发布带来的兼容性问题。”
凭借初创公司经历——多年起伏锤炼出的编译器技术,如今已被几乎所有加速器厂商采用——埃兰戈万坚信:“我们必须对路径保持信念,然后一步接一步前行。”

|
|
|
|
TOP
©Copyright www.eic.net.cn 2003-2026 BeiJing MengKaiGuan Software Exploiture Co.,Ltd. All Rights Reserved.    北京梦开关科技有限公司
IC元器件库存管理软件 IC元器件库存管理系统 IC元器件管理软件 IC元器件进销存 IC元器件库存管理软件 IC元器件库存管理系统 快递查询接口
QQ: 880717
18500810082