4. 通月,AMD 认识到外部开发者社区是 CUDA 成功的关键,并从此采用了 “开发者优先” 战略。
9. AMD 应大幅增加并优先分配其研发资本支出和运营支出计划的投资,为其团队提供更多的 GPU 资源用于软件开发。目前对季度收益的短视关注损害了其长期竞争力。AMD 需要投资更多的 GP。
8. 过去四个月,AMD 的内部开发集群有了显著改善,但这些增强仍不足以在长期的 GPU 开发格局中有效竞争。
本文将讨论 AMD 所做的许多积极改变。他们正走在正确的轨道上,不过,他们应该增加 GPU 计算时长的研发预算,并在 AI 人才方面进行更多投资。本文还将提供额外建议,并阐述 AMD 管理层的漏洞:AMD薪酬结构以错误的公司为基准,因此在争夺 AI 软件工程师的竞争中缺乏竞争力。
7. AI 软件工程薪酬是 AMD 管理层的漏洞,因为他们的总薪酬明显低于英伟达和 AI 实验室等擅长 AI 软件的公司。
自semianalysis在 2024 年 12 月发表一篇详细分析 AMD 软件平庸且缺乏可用性的文章后,AMD 加快了他们的步伐,并在过去4个月针对文章所指的问题取得了快速进展。本文认为,AMD 新的紧迫感是其追赶英伟达过程中的一大积极因素。AMD 现在处于战时状态,并且前方有许多战斗等着他们。
1. 本文团队与 Lisa Su 进行了会面,并介绍了团队的发现,她认识到了 ROCM 软件栈中的许多差距,并表达了强烈的改进愿望。
6. AMD 计划借鉴谷歌的 TPU 研究云(TRC)模式,并在即将于 6 月举行的 Advancing AI 活动中推出开发者云。成功的衡量标准是是否在 AMD 的社区开发者云上出现 “GPT-J 时刻”。