test2_首次超越自回归模型!蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer_竞彩足球预测网
新浪科技讯 10月13日下午消息,首次蚂蚁集团正式开源业界首个高性能扩散语言模型推理框架dInfer。归模个高
据介绍,型蚂性竞彩足球预测网在基准测试中,蚁集源业语dInfer将扩散语言模型的团开推理推理速度相比于英伟达扩散模型框架Fast-dLLM提升了10.7倍;在代码生成任务HumanEval上,dInfer在单批次推理中创造了1011Tokens/秒的内首速度,首次在开源社区中实现扩散语言模型的扩散框架单批次推理速度显著超越自回归模型。dInfer的模型工作表明,扩散语言模型具备显著的首次效率潜力,可以通过系统性的归模个高竞彩足球预测网创新工程兑现,为通往AGI的型蚂性架构路径提供极具竞争力的选项。
在配备8块NVIDIA H800 GPU的蚁集源业语节点上,dInfer的团开推理性能表现令人瞩目:
在与先前的dLLM推理方案Fast-dLLM的对比中,dInfer在模型效果持平的内首情况下,平均推理速度(avg TPS)实现了10.7倍的扩散框架巨大提升(681 vs 63.6) ;在代码生成任务HumanEval上,dInfer在单批次推理中创造了1011 tokens/秒的速度 ;与在业界顶尖的推理服务框架vLLM上运行的、参数量和性能相当的AR模型Qwen2.5-3B相比,dInfer的平均推理速度是其2.5倍(681 vs 277) 。
蚂蚁集团表示,dInfer连接了前沿研究与产业落地,标志着扩散语言模型从“理论可行”迈向“实践高效”的关键一步。此次开预案,也是诚邀全球的开发者与研究者共同探索扩散语言模型的巨大潜能,构建更加高效、开放的AI新生态。
海量资讯、精准解读,尽在新浪财经APP 责任编辑:何俊熹
相关文章:
- 京东宣布追加超过3000万元物资,保障香港大埔火灾后民生所需
- 特斯拉高管解读Q3财报:三星芯片协议不会取代英伟达
- 美团机器人研究院学术年会在杭举行 发布无人机避障、灵巧手等多项技术突破
- 一个月两个亿元大单!360杀入AI牌局
- 小红书捐赠500万港元,支援香港大埔救灾
- 一加中国区总裁李杰:今年销量同比增速达36.7%,24岁以下用户规模同比增长106%
- 工业富联Q3财报:单季净利首次突破百亿 同比增长62.04%
- “屠夫”主帅+全员狠人,赫塔费为什么让人又恨又怕?
- 华为联合三大高校发布并开源AI容器技术Flex:ai,助力破解算力资源利用难题
- 真我GT8系列发布:全系搭载理光GR影像系统,售价2899元起
相关推荐:
- OTA进阶及新车色发布,比亚迪唐L置换补贴后售价21.48万元起
- 焕新极氪7X正式上市:全系标配千里浩瀚辅助驾驶系统H7,限时售价21.98万元起
- 京东健康:今年累计首发超20款医疗器械新品,11.11成交额环比增长均超100%
- 好未来2026财年Q2财报:净收入8.61亿美元,同比增长39.2%
- 盒马前CEO侯毅推出“老菜芮选”,正式进军直播带货领域
- 汉王与京东健康签订合作协议,携手提供血压计使用指导上门服务
- 货拉拉更新招股书:2025年上半年履约订单同比增长34%,变现率持续走低
- 松延动力即将发布人形机器人Bumi小布米,限时售价9998元
- 快手第三季度营收356亿元 经调净利润50亿元
- 巨人网络启用游戏业务负责人轮值机制,刘伟将出任公司CEO、总经理职务
