北京时间 5 月 28 日晚,DeepSeek 小助手在微信群发布通知称,DeepSeek R1 模型已完成小版本试升级,欢迎前往官方网页、APP、小程序测试(打开深度思考),API 接口和使用方式保持不变。

作为 DeepSeek-R1 系列的重要升级版本,DeepSeek-R1-0528 在模型架构、推理能力和开放性方面均有显著提升。

目前,没有 DeepSeek-R1-0528 新版模型的技术报告,29 日凌晨,模型文件已上传到 Hugging Face 模型仓库:

https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main

DeepSeek 官网未出现此次版本更新的变更日志,但从大家实测反馈来看,R1 新版在以下方面表现出了改进:

  • 思维链更新:思维链(CoT)行为发生显著变化,深度推理能力媲美 OpenAI-o3 高版本、Google Gemini Pro,能进行长思考。

  • 响应质量优化:复杂推理、多步骤计算更准确;长文理解与生成更连贯、逻辑更清晰;数学、编程等专业性输出更可靠。

  • 编程能力提升:在网页端、App、API 接口中响应更敏捷;尤其在处理超长文本输入时,延迟有所降低。

  • 对话稳定性增强:上下文记忆更稳定,尤其在超长对话中(支持最多 128K 上下文);减少偶尔「遗忘设定」或「跑偏」的情况。

  • API 和接口兼容性保持稳定:API 调用方式、参数、返回结构完全不变;用户无需调整现有集成,即可无缝使用新版本。

  • 作为国内领先的 AI 推理服务平台,七牛云已在第一时间在 AI 大模型推理产品中部署上新了 DeepSeek-R1-0528 新推理模型,欢迎新老用户体验使用!

市场虽然没有期待来传闻中的 DeepSeek-R2 模型,R1-0528 就像两个月前的 V3-0324(支持工具调用)一样,还是小幅而明显的改进了模型在特定领域的表现,值得体验试用。就像今年以来更热的编程 Agent、以及新近发布的 Claude 4 一样,提升编程和推理能力、提升工具调用能力仍是当前顶级推理大模型更新升级的重心。

进入七牛云小程序 ,可免费领取 300 万推理额度。

采用 DeepSeek-R1-0528 新模型生成的部分网页编程示例如下: