9 月 29 日,DeepSeek 正式推出实验性大模型 V3.2-Exp,以自研 DSA 稀疏注意力机制实现效率突破,同步官宣 API 降价超 50%

作为 V3.1-Terminus 升级版本,其核心创新在于 DSA 细粒度稀疏注意力技术,通过稀疏模式识别与选择性计算,将长文本推理速度提升 2-3 倍,内存占用降低 30%-40%,训练效率提升 50%。权威测试显示,模型 MMLU-Pro 得分维持 85.0 的高水平,数学推理、编程竞赛等任务性能还有提升。

API 新价格即刻生效:缓存命中输入低至 0.2 元 / 百万 token,输出降至 3 元 / 百万 token,高缓存场景成本降幅达 70%-80%。此次同步开源 TileLang 与 CUDA 双版本算子,降低技术依赖,寒武纪、华为云已完成适配。

七牛云 AI 推理平台上新 DeepSeek-V3.2-Exp

作为国内领先的 AI 推理服务平台,七牛云已在第一时间完成 DeepSeek-V3.2-Exp模型的部署与调优。开发者无需本地部署,即可通过控制台或 API 快速调用。

9 月 29 日,Anthropic 也正式发布了最强编程模型 Claude Sonnet 4.5,上演了大模型领域一日千里的激烈攻防战。4.5 在Terminal Bench进入50%分位,在agentic tool use的bench上更是有一个质的飞跃,从 71 来到了 98。

现在登录七牛云小程序即可轻松体验所有新模型。新用户还可免费领取 300 万全系列模型抵扣 Tokens,放心测试性能无压力。 

扫码添加「牛小七」,快速获取热门开源大模型上新提醒、调用教程与专属福利,让你始终快人一步体验前沿 AI 能力,抢占技术落地先机!