互动

最近评论

标签

寻找感兴趣的领域

文章

AI与智能服务

DeepSeek-V3.2-Exp 上新：推理提速2倍，API 降价50%

字数: 3996 阅读耗时: 9 分钟 2025/09/30

9 月 29 日，DeepSeek 正式推出实验性大模型 V3.2-Exp，以自研 DSA 稀疏注意力机制实现效率突破，同步官宣 API 降价超 50%。

作为 V3.1-Terminus 升级版本，其核心创新在于 DSA 细粒度稀疏注意力技术，通过稀疏模式识别与选择性计算，将长文本推理速度提升 2-3 倍，内存占用降低 30%-40%，训练效率提升 50%。权威测试显示，模型 MMLU-Pro 得分维持 85.0 的高水平，数学推理、编程竞赛等任务性能还有提升。

API 新价格即刻生效：缓存命中输入低至 0.2 元 / 百万 token，输出降至 3 元 / 百万 token，高缓存场景成本降幅达 70%-80%。此次同步开源 TileLang 与 CUDA 双版本算子，降低技术依赖，寒武纪、华为云已完成适配。

七牛云 AI 推理平台上新 DeepSeek-V3.2-Exp

作为国内领先的 AI 推理服务平台，七牛云已在第一时间完成 DeepSeek-V3.2-Exp模型的部署与调优。开发者无需本地部署，即可通过控制台或 API 快速调用。

9 月 29 日，Anthropic 也正式发布了最强编程模型 Claude Sonnet 4.5，上演了大模型领域一日千里的激烈攻防战。4.5 在Terminal Bench进入50%分位，在agentic tool use的bench上更是有一个质的飞跃，从 71 来到了 98。

现在登录七牛云小程序即可轻松体验所有新模型。新用户还可免费领取 300 万全系列模型抵扣 Tokens，放心测试性能无压力。

扫码添加「牛小七」，快速获取热门开源大模型上新提醒、调用教程与专属福利，让你始终快人一步体验前沿 AI 能力，抢占技术落地先机！

阅读建议

从“底座之争”到“生态博弈”：如何构建可迁移、可兼容的AI技术架构

AI时代想赚钱，先搞懂“信息差”和“价值差”的区别。

Grok 4.1登顶榜单，AI模型神仙打架，开发者如何一行代码不改笑看风云

手把手教程：用七牛云 + Obsidian + PicGo，搭建创作者的高效内容工作流

别让成本卡创新！七牛云邀好友得百亿 Token，AI 推理省钱又省心

AI Coding 入门：新手小白 10 分钟快速生成天气查询实用工具