您的当前位置:首页 > 娱乐 > 黄仁勋、苏姿丰点赞:英伟达、AMD 力挺 InferenceMAX 开源新基准 正文
时间:2025-10-14 12:03:25 来源:网络整理 编辑:娱乐
IT之家 10 月 11 日消息,科技媒体 Tom's Hardware 昨日10 月 10 日)发布博文,报道称分析机构 SemiAnalysis 近日发布了一款名为 InferenceMax 的开
IT之家 10 月 11 日消息,黄仁科技媒体 Tom's Hardware 昨日(10 月 10 日)发布博文,勋苏新基报道称分析机构 SemiAnalysis 近日发布了一款名为 InferenceMax 的姿丰准漯河市某某餐饮管理维修网点开源 AI 基准测试套件,专注于衡量在真实 AI 推理(模型实际运行)场景下,点赞达由驱动、英伟内核、力挺框架等组成的开源整个软件堆栈的综合效率。
IT之家援引博文介绍,黄仁人工智能领域的勋苏新基焦点几乎完全集中在芯片交易和 GPU 等硬件发展上,现有的姿丰准基准测试也大多只关注硬件性能,因此 InferenceMax 希望提供一个开源且厂商中立的点赞达 AI 基准测试套件。该项目以滚动发布的英伟方式,每晚更新测试结果,力挺从而能够动态追踪软件更新对性能的开源持续影响。
InferenceMax 引入了两个相互制约的黄仁漯河市某某餐饮管理维修网点关键性能指标。其一是“吞吐量”,指在单位时间内处理更多并发请求的能力,这有利于最大化 GPU 利用率;其二是“交互性”,指为单个用户提供更快响应速度的能力,例如在聊天机器人场景中。
在两者之间取得理想平衡(即帕累托前沿曲线上的最佳点)至关重要。最终,对于服务提供商而言,衡量投资回报的终极标准是“总拥有成本”(TCO),即处理每百万 token 所需花费的美元。InferenceMax 致力于估算不同硬件采购或租赁方案下的 TCO,为用户提供最具经济效益的选择依据。
InferenceMax 的初步测试提供了一些颠覆性的见解。例如,尽管英伟达的 B200 在原始速度上遥遥领先,但在综合考量 TCO 后,AMD 的 MI335X 在特定场景下展现出了极强的竞争力,这表明,最快的芯片不一定是最经济高效的选择。
同时,测试也暴露了 AMD 在 FP4(4 位浮点格式)内核方面尚有改进空间,目前依赖该数学格式的场景仍由英伟达芯片主导。这些发现凸显了单纯比较硬件参数的局限性,软件优化与成本效益正成为评估 AI 性能的关键。
InferenceMax 的开发过程得到了英伟达、AMD 及多家云服务商的深度协作。这种合作不仅帮助项目获取了真实的硬件与软件配置方案,还意外地发现了两大巨头软件堆栈中的多个错误。
例如,项目组协助 AMD 修复了其 ROCm 软件中的问题,并建议 AMD 提供更优的默认配置以简化性能调优。对于英伟达,测试则暴露了其新款 Blackwell 驱动在快速启停实例时存在初始化相关的障碍。
英伟达首席执行官黄仁勋表示:
在长上下文推理的推动下,推理需求呈指数级增长。NVIDIA Grace Blackwell NVL72 正是为这个充满思考力的 AI 新时代而生。NVIDIA 通过持续的硬件和软件创新来满足这一需求,从而赋能 AI 的未来发展。 通过频繁的基准测试,InferenceMax 让业界能够清晰地了解 LLM 推理在实际工作负载下的性能。结果显而易见:搭载 TRT-LLM 和 Dynamo 的 Grace Blackwell NVL72 可提供无与伦比的单位成本和单位兆瓦性能,为全球生产力最高、成本效益最高的 AI 工厂提供支持。
AMD 首席执行官苏姿丰表示:
开放式协作正在推动人工智能创新的新时代。开源 InferenceMax 基准测试为社区提供透明的每日结果,从而激发信任并加速进步。 它凸显了我们的 AMD Instinct MI300、MI325X 和 MI355X GPU 在不同工作负载下具有竞争力的 TCO 性能,彰显了我们平台的强大实力以及我们致力于让开发人员实时了解软件进度的承诺。
IT之家附上参考地址
难以复现类人的灵活双手,特斯拉二代人形机器人被曝暂停量产2025-10-14 11:56
夏天洗冷水澡,更容易降温吗?丨中新真探2025-10-14 11:53
共和报:曼城准备激活邓弗里斯2500万欧解约金2025-10-14 11:10
湖南资兴东江湖发生沉船事故 有人员失联2025-10-14 11:05
太火爆了!北京这些景区游客“扎堆”,“人从众”里有你吗?2025-10-14 10:24
俄罗斯周边,又有新麻烦了2025-10-14 10:21
当中高考题开始“追新闻热点”,我们该怎么接招?2025-10-14 10:04
特朗普:美国将对乌克兰输送更多武器2025-10-14 09:47
每本书最高索赔15万美元!苹果因AI版权问题被告上法庭2025-10-14 09:34
TTS新传论文带读:用“传播”沟通人和神(来啊!!研究占卜啊!!)2025-10-14 09:23
「限高」取消,王健林虚惊一场?2025-10-14 11:54
史上最真实的F1电影,是怎么拍出来的?2025-10-14 11:49
高温之下 吃“冰”也要讲究“科学性”2025-10-14 11:33
特朗普威胁金砖国家,卢拉反驳:世界不需要皇帝2025-10-14 11:03
中新健康丨1块月饼=4碗饭?健康吃月饼记住6个小技巧2025-10-14 11:01
百亿市值上市公司董事疑似坠楼去世,年仅54岁2025-10-14 10:37
全国消暑美食大赏:荆芥、折耳根、酿菜……你pick哪一味?2025-10-14 10:11
广东2025高考状元716分,其作文曝光,字迹漂亮,老师不忍扣分2025-10-14 09:38
时隔6个月 运载燃料物资的卡车首次进入加沙地带2025-10-14 09:37
特朗普对日本、韩国加征关税2025-10-14 09:16