中国科协| 智链研究院| 机构简介| 申请加入| 资料下载

创新力服务平台

INNOVATION CAPABILITY SERVICE PLATFORM

首页 > 资讯 > 前沿科技 > 正文

蚂蚁百灵发布AI新模型,推理成本仅为同类十分之一

4月22日,蚂蚁集团百灵大模型团队推出新款Instruct模型Ling-2.6-flash。该模型总参数量1040亿,激活参数量74亿,采用混合线性架构,是一种高度稀疏化的MoE设计。模型已通过API开放,输入每百万tokens定价0.1美元,输出0.3美元,首周提供免费试用。

此前一周,一个名为Elephant Alpha的匿名模型在OpenRouter平台上线,调用量迅速攀升,连续多日位列Trending榜首,日均tokens调用量达100亿级别,周增长超过5000%。百灵今日确认,Elephant Alpha正是Ling-2.6-flash的匿名测试版本。

在性能方面,Ling-2.6-flash在4卡H20环境下推理速度最快可达每秒340个tokens,稳定输出为每秒215个tokens。其Prefill吞吐量达到Nemotron-3-Super的2.2倍。

在Artificial Analysis的完整评测中,该模型仅消耗1500万tokens完成全部评测任务,而Nemotron-3-Super等同类模型需要1.1亿tokens以上,消耗约为后者的十分之一。

此外,模型针对Agent场景做了定向增强,在BFCL-V4、TAU2-bench、SWE-bench Verified等多项基准测试中达到同尺寸模型的最佳水平。

从行业对比来看,MoE架构已成为大模型的主流技术路线。DeepSeek-V3总参数6710亿,激活参数370亿;阿里通义千问Qwen3.5-35B-A3B总参数350亿,激活参数30亿;字节跳动豆包2.0 Pro总参数7440亿,激活参数约40至44亿。

各家都在围绕激活参数这一指标进行优化,试图在模型能力与推理成本之间寻找更优的平衡点。

一个值得关注的现实是,当模型厂商纷纷将激活参数和成本效率作为核心卖点时,用户在实际业务场景中究竟更看重单位token的成本,还是模型解决复杂任务的鲁棒性?这个问题的答案,可能比任何技术参数都更能决定下一代大模型的市场走向。


AI

最新资讯

我国制定的MA医疗器械国际通用代码登陆欧洲医疗制造市场

近日,由欧洲牙科工业协会(FIDE)指导,德国牙科工业协会(VDDI)举办的“UDI”的年度技术研讨会在德国举行。会上,德国发码机构欧洲数据委员会(EDC)HaraldOehlmann博士向与会代表详细介绍了由我国中

573
什么是MA码?

工业互联网是新一代信息技术与工业经济深度融合的关键基础设施、新型应用模式和全新经济生态,通过人、机、物的全面互联,构建起覆盖全要素、全产业链、全价值链的全新制造和服务体系,为工业乃

238
草料二维码新增 MA 标识代码支持化妆品电子标签合规搭建

近日,草料二维码已完成与中关村工信二维码技术研究院(以下简称“中码院”)发行的国际标准 MA 标识代码体系的技术对接,企业可通过草料二维码平台完成电子标签搭建,无需额外开发,即可满足《国家药

572
巨星陨落!钱学森学生戴汝为院士逝世,享年94岁

4月19日,中国科学院院士、中国科学院大学荣誉讲席教授、中国科学院自动化研究所研究员戴汝为在北京逝世,享年94岁。这位将毕生精力献给我国自动控制、模式识别、智能科学事业的科学家,用七十

677
中国第一省会GDP为何突然猛增

万万没想到,广州GDP这么快又反超重庆了,增速还是五大城市第一名。就在今天上午,广州发布2026年一季度经济数据,我给大家划一下重点:首先是GDP反超重庆,广州是7999.88亿元,重庆是7923.49亿

691
蚂蚁百灵发布AI新模型,推理成本仅为同类十分之一

4月22日,蚂蚁集团百灵大模型团队推出新款Instruct模型Ling-2.6-flash。该模型总参数量1040亿,激活参数量74亿,采用混合线性架构,是一种高度稀疏化的MoE设计。模型已通过API开放,输入每百万t

722

更新文章

48小时
|
阅读排行