数据管理与存储
未读
llpyg: LLGo 快速集成 Python 生态的桥梁
前言 LLGo[1] 是一款基于 LLVM 的 Go 编译器,通过 LLVM 为 Go 语言整合了 C 和 Python 语言生态,让开发者可以更工程化地在 Go 中使用海量的 Python 生态库,比如直接使用 numpy、torch 等库。
X绘图:我们如何让 AI 更好地融入产品
前言 我们正处于 AI 大模型落地的浪潮中。越来越多的应用都喜欢标榜“AI 赋能”、“AI 融入”。但是,很多应用和程序并没有很好的将 AI"融入"他们的应用,而只是做了"引入",一个按钮,一个接口,一个对话框;一个简单的引入 API 确实能带来 AI 对话的能力,但是这和真正的让AI提升工作效率和
AI与智能服务
未读
SPX-Algorithm:构建多模态搜索服务的一些心得
项目背景和定位 SPX-Algorithm 本质上是一个图像搜索推荐模块。用户输入文本描述,系统从图片库里找出最相关的结果。听起来简单,但实际做起来发现挑战不少。 传统的图片搜索主要靠标签匹配,但这种方式局限性很明显。图片的标签往往不够丰富,用户的表达又很灵活。所以我的目标很明确:用AI来理解文本和
AI与智能服务
未读
关于架构设计的几点认知体会
架构设计,在很多人眼里是个高大上的话题。 一提到架构,很多人脑海中浮现的可能是高并发、高可用、微服务、分布式这些听起来就很 “技术” 的词汇。似乎只有那些处理海量数据、支撑千万用户的系统才需要做架构设计,而日常的业务开发,就是按需求写代码,哪里需要什么架构? 恰恰相反,在我看来,这种认知是对架构设计
AI与智能服务
未读
阿里发布万亿参数AI数学竞赛拿满分,中国AI这次真遥遥领先了?
2025年9月24日,在杭州云栖大会上,阿里巴巴正式发布了其首个参数量超过一万亿的旗舰级大型语言模型——Qwen3-Max。紧随其后,一个更令人震撼的消息传来:其推理增强版本,在两项国际顶级的数学竞赛基准测试中,取得了国内首次满分100%的突破性成绩。 这一系列成就,迅速在全球科技界引发热议。从LM
AI与智能服务
未读
从vLLM到icepop:一文读懂大模型推理优化的技术全景图
无论 AI 大模型的参数量达到多么惊人的万亿级别,其最终能否在产业界广泛落地,关键取决于一个核心环节 —— 推理(Inference)。推理,即模型在完成训练后,实际对外提供服务的应用过程。其效率和成本,直接决定了 AI 应用的商业可行性。 2025 年,我们见证了美团、蚂蚁等巨头相继开源其高效推理
AI与智能服务
未读
美团蚂蚁接连开源:深度解析LongCat与Ring-flash背后的MoE效能革命
2025 年 9 月,国内 AI 大模型领域迎来了一场技术风暴。美团与蚂蚁集团,两家科技巨头相继开源了其最新的、基于混合专家(MoE)架构的大语言模型 ——LongCat-Flash-Thinking 与 Ring-flash-2.0。这一系列动作,不仅在开源社区引发了热烈讨论,更清晰地标志着,AI
AI与智能服务
未读
深度解析DeepSeek V3.1-Terminus的技术演进与Agent雄心
在快速迭代的AI大模型领域,每一次重要的版本更新都不仅仅是参数的增加或性能的跑分,更可能预示着技术路线的演进和未来方向的明确。2025年9月22日晚间,DeepSeek团队发布的DeepSeek V3.1-Terminus版本,正是这样一个值得深度关注的里程碑。 对于许多开发者而言,这次更新最直观的
AI与智能服务
未读
Code Review 不是什么——盘点5个常见误区
1. Code Review 不是帮你找出你自己能发现的问题 诚然,Code Review 是为了发现问题的,但它并不是为了发现那些你自己本可以发现的问题。协作的成本总是高于个人,相同的问题,依赖 Code Review 来发现并沟通解决,需要付出的时间和精力,一定是远高于个人独立发现并解决的。 因