AI与智能服务
未读
SPX-Algorithm:构建多模态搜索服务的一些心得
项目背景和定位 SPX-Algorithm 本质上是一个图像搜索推荐模块。用户输入文本描述,系统从图片库里找出最相关的结果。听起来简单,但实际做起来发现挑战不少。 传统的图片搜索主要靠标签匹配,但这种方式局限性很明显。图片的标签往往不够丰富,用户的表达又很灵活。所以我的目标很明确:用AI来理解文本和
AI与智能服务
未读
关于架构设计的几点认知体会
架构设计,在很多人眼里是个高大上的话题。 一提到架构,很多人脑海中浮现的可能是高并发、高可用、微服务、分布式这些听起来就很 “技术” 的词汇。似乎只有那些处理海量数据、支撑千万用户的系统才需要做架构设计,而日常的业务开发,就是按需求写代码,哪里需要什么架构? 恰恰相反,在我看来,这种认知是对架构设计
AI与智能服务
未读
阿里发布万亿参数AI数学竞赛拿满分,中国AI这次真遥遥领先了?
2025年9月24日,在杭州云栖大会上,阿里巴巴正式发布了其首个参数量超过一万亿的旗舰级大型语言模型——Qwen3-Max。紧随其后,一个更令人震撼的消息传来:其推理增强版本,在两项国际顶级的数学竞赛基准测试中,取得了国内首次满分100%的突破性成绩。 这一系列成就,迅速在全球科技界引发热议。从LM
AI与智能服务
未读
从vLLM到icepop:一文读懂大模型推理优化的技术全景图
无论 AI 大模型的参数量达到多么惊人的万亿级别,其最终能否在产业界广泛落地,关键取决于一个核心环节 —— 推理(Inference)。推理,即模型在完成训练后,实际对外提供服务的应用过程。其效率和成本,直接决定了 AI 应用的商业可行性。 2025 年,我们见证了美团、蚂蚁等巨头相继开源其高效推理
AI与智能服务
未读
美团蚂蚁接连开源:深度解析LongCat与Ring-flash背后的MoE效能革命
2025 年 9 月,国内 AI 大模型领域迎来了一场技术风暴。美团与蚂蚁集团,两家科技巨头相继开源了其最新的、基于混合专家(MoE)架构的大语言模型 ——LongCat-Flash-Thinking 与 Ring-flash-2.0。这一系列动作,不仅在开源社区引发了热烈讨论,更清晰地标志着,AI
AI与智能服务
未读
深度解析DeepSeek V3.1-Terminus的技术演进与Agent雄心
在快速迭代的AI大模型领域,每一次重要的版本更新都不仅仅是参数的增加或性能的跑分,更可能预示着技术路线的演进和未来方向的明确。2025年9月22日晚间,DeepSeek团队发布的DeepSeek V3.1-Terminus版本,正是这样一个值得深度关注的里程碑。 对于许多开发者而言,这次更新最直观的
AI与智能服务
未读
Code Review 不是什么——盘点5个常见误区
1. Code Review 不是帮你找出你自己能发现的问题 诚然,Code Review 是为了发现问题的,但它并不是为了发现那些你自己本可以发现的问题。协作的成本总是高于个人,相同的问题,依赖 Code Review 来发现并沟通解决,需要付出的时间和精力,一定是远高于个人独立发现并解决的。 因
AI与智能服务
未读
Grok 4 Fast vs GPT-5-mini:新一代高效AI模型开发者该如何选
2025 年下半年,人工智能模型领域风起云涌。OpenAI 于 8 月发布了备受瞩目的 GPT-5 系列,其中 GPT-5-mini 以其惊人的性价比迅速成为社区焦点;仅仅一个月后,xAI 于 9 月推出的 Grok 4 Fast,则在速度和成本效益上,再次刷新了业界的认知。 这两款模型的出现,共同
AI与智能服务
未读
不止是更快更便宜:深度解析Grok 4 Fast的统一架构与Agentic能力
2025年9月19日,xAI公司发布了其最新一代高效AI模型——Grok 4 Fast。这款模型一经推出,便凭借其革命性的成本效益和惊人的响应速度,迅速在全球技术社区引发热议。报告显示,它能以大约二十五分之一的成本,实现与业界顶级模型相媲美的智能水平,其每秒344个令牌的输出速度,更是刷新了前沿模型