近日,OpenAI 官方发布了全新开源语言模型系列—— GPT-OSS,包括两款不同体量的模型:GPT-OSS-120b 和 GPT-OSS-20b。这是 OpenAI  自 2019 年推出 GPT-2 以来首次推出开源模型。模型权重、推理代码、配置参数均已开放,具备完整函数调用和结构化输出能力,直接支持 Agent 场景。

七牛云 AI 大模型推理平台第一时间完成接入,GPT-OSS-120b 和 GPT-OSS-20b 均已上线可用,欢迎新老用户前往体验。进入七牛云小程序,可以免费领取 300 万 全系列模型抵扣 Tokens。

GPT-OSS 模型介绍

OpenAI 此次开源的 GPT-OSS 模型定位为社区通用大语言模型,具备函数调用、工具调用、结构化输出等关键能力,可直接用于搭建 Agent 架构、知识问答、RAG 检索生成等场景。

  • GPT-OSS-120b:1170 亿参数,采用混合专家(MoE)架构,推理时仅激活 4 个专家,兼顾性能与效率,支持最长 128K 上下文输入。

  • GPT-OSS-20b:轻量级 MoE 架构,激活参数约 36 亿,在资源有限场景下亦可稳定运行,适合边缘部署和快速集成。 

两款模型均采用 Apache 2.0 协议开源,已上传至 Hugging Face 模型仓库,企业或个人都可以直接本地部署。

七牛云 AI 推理平台上新 GPT-OSS

作为国内领先的 AI 推理服务平台,七牛云已在第一时间完成 GPT-OSS 模型的部署与调优。目前两款模型均已集成进七牛云模型广场中,开发者无需本地部署,即可通过控制台或 API 快速调用。


现如今,更多大模型厂商将函数调用能力列为默认支持项,而开源模型也逐渐开始补齐 Agent 生态支持。此次 OpenAI 直接开放模型权重,显示其在支持私有化部署、赋能开发者生态上的新态度。
七牛云也将持续跟进主流模型技术,支持更多具备函数调用、Agent 接口能力的大模型。