
【开发者周报】Grok 4即将发布/小扎组建超级智能实验室/Cursor上线Web App/上海交大智能体登顶世界第一……
【开发者周报第2期】2025/06/30-07/04
更多精彩内容请访问www.qiniu.com
最近技术圈又热闹了,马斯克在公司扎帐篷、熬夜“爆肝”Grok新版本;小扎四处“挖人”,立志要带Meta在AI领域打场翻身仗;上交大“杀出一匹黑马”,AI专家智能体「ML-Master」炼成“Kaggle特级大师”,干掉微软,登顶世界第一……赶紧来看看本周精彩的开发圈故事:
Fast Reading:
快速抓重点
1.马斯克旗下xAI的Grok 4系列模型即将发布
2.扎克伯格组建“超级智能实验室”
3.Cursor Agents上线Web&移动端
4.上交大AI智能体炼成“Kaggle特级大师”
5.Lovart国内版正式上线星流AI
内容详情
1、马斯克的Grok 4模型将于7月4日后发布:xAI人工智能领域最新进展
马斯克旗下xAI的Grok 4系列模型信息近期泄露,包括旗舰模型Grok 4(7月4日后发布)和编程模型Grok 4 Code。据了解,Grok 4目前仅支持文本模态,上下文窗口13万tokens(小于Grok 3的100万),但支持函数调用、结构化输出等功能;Grok 4 Code定位编程助手,可嵌入Cursor等IDE工具。
这是xAI在AI模型迭代中的关键进展:Grok 4通过调整上下文窗口降低计算压力,强化实用功能(如函数调用、结构化输出),试图平衡性能与效率;Grok 4 Code的推出则凸显xAI对开发者市场的重视,意图通过编程场景抢占用户与企业市场。但事件也暴露争议——用户对Grok 3“宣传与能力不符”“个人色彩过重”的质疑延续至Grok 4,模型实际表现与市场接受度待验证。
对开发者而言,Grok 4 Code与Cursor等主流IDE的集成可能简化编程流程,函数调用和结构化输出功能可提升API调用效率,推动AI与开发工具的深度融合;行业层面,xAI对编程模型的聚焦或加速AI在代码生成、辅助开发场景的普及,但需警惕模型争议对开发者信任的影响——若Grok 4无法解决“个人色彩”与“能力匹配”问题,可能延缓其在开发者社区的推广速度。
2、扎克伯格组建“超级智能实验室”,11人团队7人是华人
Meta创始人扎克伯格通过内部备忘录宣布成立「超级智能实验室(MSL)」,整合基础模型研发(开源Llama)、FAIR(LeCun带队)、AI产品三大核心团队,由28岁Alexandr Wang任首席AI官,Nat Friedman负责产品及应用研究。
目前MSL已组建11人超豪华团队:
多位GPT-4o和GPT-4.1的核心成员:Shengjia Zhao、Jiahui Yu、Shuchao Bi、Hongyu Ren;
来自Anthropic的高级工程师Joel Pobar,此前曾在Meta任职11年;
DeepMind的Jack Rae和Pei Sun,曾负责Gemini模型和多模态推理系统;
OpenAI语音与图像模型的重要推动者Huiwen Chang、Ji Lin等。
值得注意的是,这支队伍中华人占比超半数。据了解,MSL目标开发“能与人甚至优于人类完成任务的超级智能”,预计明年达到技术前沿。
这是Meta在AI领域的重大战略升级:通过整合内部资源与全球顶尖人才,强化超级智能研发能力,意图抢占AI技术制高点;同时反映大模型竞争进入“人才争夺”深水区,Meta凭借10亿月活用户生态、AI眼镜等产品落地经验及高效组织架构,试图重新定义AI研发效率与方向。
MSL的成立将加速AI前沿技术的研发与落地,可能推动开发者工具链的创新;其开放的业务生态或吸引开发者参与超级智能应用开发;但团队对顶尖人才的虹吸效应也可能加剧行业人才竞争,倒逼企业提升技术投入与研发能力。
3、Cursor上线Web App,可在浏览器直接调度AI Agent写代码
日前,AI编码助手Cursor宣布上线Web App,支持浏览器直接调度AI Agent完成编码任务,结合此前推出的后台Agent和Slack集成,形成“无IDE也能工作”的灵活编程体验。Web App适配移动浏览器与PWA,支持任务调度、上下文同步、链接共享协作、GitHub集成(BugBot检测代码)等功能;手机版精简但支持轻量任务管理与远程协作。此外,Anysphere(Cursor母公司)年化收入突破5亿美元,估值达99亿美元,三年增长超4倍,拒绝OpenAI收购,客户覆盖超半数《财富》500强企业。
这是AI编程助手从“代码辅助工具”向“任务管理平台”的关键转型:通过多入口(浏览器、Slack、移动端)覆盖开发全流程,实现“任务派发-自动执行-协作跟进”的闭环,降低用户使用摩擦;Anysphere的高速增长与客户覆盖,标志着AI编程工具进入规模化商用阶段,行业竞争焦点从“单点功能”转向“全流程效率”。
Cursor Web App与移动端支持打破了设备限制,任务调度、上下文同步等功能简化了开发流程,多人协作链接共享提升远程团队效率;行业层面,其“任务闭环”模式推动AI编程助手从“代码补全”向“工作分担”升级,可能加速开发者工具链的重构;此外,Anysphere拒绝收购、独立融资的成功案例,或激励更多AI编程初创企业探索垂直场景的深度整合,加剧行业创新竞争。
4、Kaggle特级大师!上交大AI智能体登顶OpenAI MLE-bench
上海交通大学人工智能学院Agents团队开发的AI专家智能体「ML-Master」,在OpenAI权威基准测试MLE-bench中以29.3%的平均奖牌率登顶(超越微软RD-Agent的22.4%和OpenAI AIDE的16.9%),成为首个达到Kaggle「Grandmaster」(特级大师)水平的AI系统。
ML-Master通过创新的「探索-推理深度融合」范式(平衡多轨迹探索+可控推理+自适应记忆机制),解决了AI4AI(AI自主优化AI)领域探索与推理割裂的核心挑战,ML-Master仅在MLE-bench上探索学习900机器小时,即达成Kaggle比赛的Grandmaster级别,实现了三重突破:29.3%平均奖牌率,位居MLE-bench榜首;仅用12小时完成测试(计算成本仅为基线方法的一半);在93.3%任务中提交有效解,44.9%任务超越半数人类参赛者。
这是AI4AI技术的里程碑突破:ML-Master通过模拟人类专家的认知策略(探索与推理协同),实现了AI系统从“辅助开发”到“自主优化”的跨越,验证了AI自主演进的可行性,标志着AI4AI从“单点优化”进入“系统级自主开发”新阶段,为AI技术的自我迭代提供了可复制的技术路径。
ML-Master的高效性和多任务处理能力可降低机器学习工程门槛,简化模型训练、调参等复杂流程;其“探索-推理融合”框架为AI系统设计提供了新思路,可能推动开发工具链向“自主优化”方向升级;此外,团队计划推出的多领域智能体生态,或将加速AI技术在科研、教育等场景的普及,促进跨领域协作与创新。
5、全球首个设计智能体!Lovart国内版正式上线星流AI
此前面向海外的设计Agent工具Lovart推出国内版——新版星流AI,整合设计Agent后升级为智能多元的AI创作平台,支持“Vibe designing”(通过自然语言交互生成设计内容)。其功能覆盖批量表情包、品牌VI与包装、视频、3D模型、插画与海报等多场景设计,操作简便(登录即用,免费体验+积分制会员),并提供参考案例、调色工具及限时免费抠图等功能。用户可通过提示词快速生成批量、一致性强且高质量的设计内容,如系列表情包、品牌VI全套方案、3D模型等。
这是AI设计工具从“单点辅助”向“全流程创作平台”的关键升级:星流AI通过“Vibe designing”模式,将自然语言交互与多场景设计能力结合,实现了从需求输入到成图/视频/模型输出的高效闭环,降低了设计门槛,推动设计行业从“人工主导”向“AI辅助快速生成+人工优化”的生产方式转变;其批量处理、多类型覆盖及用户友好功能,进一步验证了AI在设计领域“降本增效”的核心价值。
星流AI可大幅减少设计素材的重复劳动时间,支持快速生成风格统一的设计资源,提升产品原型开发效率;其“Vibe designing”模式为AI辅助设计提供了新范式,可能启发开发工具集成类似智能交互功能;此外,星流的多场景覆盖能力或推动开发者在项目中更高效地整合设计资源,加速产品迭代与创新。