互动
最近评论
标签
寻找感兴趣的领域
行业应用
233
音视频云
109
技术实践
235
基础云服务
56
AI 智能
728
公司新闻
95
文章
五月 2026
154
篇
四月 2026
113
篇
三月 2026
156
篇
二月 2026
82
篇
一月 2026
90
篇
十二月 2025
42
篇
十一月 2025
4
篇
十月 2025
50
篇
九月 2025
68
篇
八月 2025
11
篇
七月 2025
20
篇
六月 2025
10
篇
五月 2025
9
篇
四月 2025
10
篇
三月 2025
11
篇
二月 2025
9
篇
一月 2025
4
篇
十二月 2024
8
篇
十一月 2024
5
篇
十月 2024
4
篇
九月 2024
4
篇
八月 2024
7
篇
七月 2024
7
篇
六月 2024
4
篇
五月 2024
3
篇
四月 2024
3
篇
二月 2024
1
篇
一月 2024
2
篇
十二月 2023
3
篇
十一月 2023
3
篇
十月 2023
3
篇
九月 2023
2
篇
八月 2023
2
篇
七月 2023
1
篇
五月 2023
1
篇
四月 2023
2
篇
三月 2023
1
篇
一月 2023
2
篇
十二月 2022
9
篇
十一月 2022
2
篇
十月 2022
1
篇
九月 2022
3
篇
八月 2022
4
篇
七月 2022
8
篇
六月 2022
4
篇
五月 2022
3
篇
四月 2022
6
篇
三月 2022
1
篇
二月 2022
4
篇
一月 2022
9
篇
十二月 2021
8
篇
十一月 2021
6
篇
十一月 2017
1
篇
十月 2017
1
篇
五月 2016
2
篇
功能
显示模式
标签
行业应用
233
音视频云
109
技术实践
235
基础云服务
56
AI 智能
728
公司新闻
95
许式伟:AI 时代,好产品的底层逻辑从未改变
手把手教程:用七牛云 + Obsidian + PicGo,搭建创作者的高效内容工作流
别让成本卡创新!七牛云邀好友得百亿 Token,AI 推理省钱又省心
从数据终点到AI起点:七牛云对象存储支持视觉理解
灵矽 AI 赋能电子吧唧:让二次元热爱,从 “静态收藏” 到 “随身伙伴”
‹
›
荐
vLLM与Ollama吞吐量差9倍,推理成本权衡
荐
通义千问2.5多模型接入实战指南:企业知识库场景的落地避坑与优化方案
荐
旧系统迁移Gemini3.5Flash架构延迟与成本
荐
老龄企业AI自动化系统架构选型与成本:打破传统工厂的智能化落地壁垒
荐
印度AI遇冷:南亚算力节点部署成本对比
荐
EdTech优化防作弊AI安全架构指南
今日推荐
Halo-Theme-Hao
更多推荐
热门专题
AI与智能服务
数据管理与存储
音视频营销
视联网
行业数字化
企业出海
首页
公司新闻
技术实践
行业应用
基础云服务
音视频云
AI 智能
AI与智能服务
未读
vLLM与Ollama吞吐量差9倍,推理成本权衡
很多技术团队在早期探索大语言模型时,通常会选择 Ollama 快速跑通本地验证。但当业务真正走向生产环境,面对多并发请求时,响应延迟往往会直线上升。近期有实测数据显示,在相同硬件下,vLLM 的并发处理能力远超前者。面对 vLLM与Ollama吞吐量差9倍,本地部署如何权衡推理成本?这不仅是技术选型
AI 智能
1天前
AI与智能服务
未读
通义千问2.5多模型接入实战指南:企业知识库场景的落地避坑与优化方案
企业知识库为什么需要通义千问2.5多模型协作 很多团队在搭建企业知识库时,都会遇到一个典型困境:开源模型响应慢、幻觉严重,而商业API的成本又让人望而却步。通义千问2.5的发布给这个矛盾提供了一个新的解题思路——它不仅开源了多个尺寸的模型版本,还支持多模型协作部署,让企业可以根据硬件条件和业务场景灵
AI 智能
1天前
AI与智能服务
未读
旧系统迁移Gemini3.5Flash架构延迟与成本
企业在面对新一代AI模型时,往往对重构底层架构感到头疼。评估旧系统迁移到Gemini 3.5 Flash架构的延迟与成本,成为技术团队的核心议题。直接在老代码里替换API端点并不现实,业务连续性要求我们必须有一套精细化的策略,既要保证原有业务逻辑不被破坏,又要最大化榨取新模型的性能红利。 大规模生产
AI 智能
1天前
AI与智能服务
未读
老龄企业AI自动化系统架构选型与成本:打破传统工厂的智能化落地壁垒
当一家平均员工年龄超过50岁的制造企业决定引入智能化改造时,管理层面临的最大阻力往往不是员工的抵触,而是高昂的试错代价。在劳动力结构性短缺的当下,老龄密集型企业部署AI自动化系统的架构选型与成本,直接决定了企业转型是平稳过渡还是被拖入财务泥潭。传统的堆机器、铺算力模式并不适用于利润率微薄的传统工厂,
AI 智能
1天前
AI与智能服务
未读
印度AI遇冷:南亚算力节点部署成本对比
孟买连续数周的40度高温不仅让当地电网告急,也直接导致众多出海企业的服务器频发宕机。原本被视为下一个增长极的印度AI市场,正因基础设施的脆弱而面临降温。企业出海算力布局面临重新洗牌,印度AI遇冷下,南亚算力节点部署的数据中心成本对比成为了IT架构师们案头最紧迫的课题。寻找稳定且经济的算力支撑,远比盲
AI 智能
1天前
AI与智能服务
未读
EdTech优化防作弊AI安全架构指南
当在线考试的作弊手段从传统的“打小抄”进化为利用微型耳机接收大模型生成的实时答案时,教育科技平台面临着前所未有的技术挑战。单纯依靠人工监考或单一的摄像头抓拍,早已无法应对这种高科技维度的降维打击。针对这一痛点,EdTech产品如何优化防作弊的AI安全架构,成为了教育行业技术升级的核心命题。 如何构建
AI 智能
1天前
AI与智能服务
未读
企业规模化部署AI算力的ROI模型与组织重组成本对比
当企业决定将大模型能力接入核心业务线时,往往会面临一个残酷的现实:高昂的GPU采购费只是冰山一角。很多技术负责人在年底复盘时发现,为了支撑算力集群而建立的庞大运维团队,以及随之而来的部门协作壁垒,正在吞噬原本预期的利润空间。这就要求我们必须进行深度的企业规模化部署AI算力的ROI模型与组织重组成本对
AI 智能
1天前
AI与智能服务
未读
Apple新Siri端侧模型与本地隐私安全:智能助手的数据合规与技术重构
智能手机的麦克风和屏幕读取权限一直是触动用户敏感神经的红线。当你向语音助手询问私人日程或健康状况时,这些数据究竟流向了何处?近期,业界对 Apple新Siri端侧模型的自动删除机制与本地隐私安全 展开了密集剖析。与以往将音频或文本打包上传公共云的传统做法不同,新一代架构通过内存级别的物理隔离与即时销
AI 智能
1天前
AI与智能服务
未读
深度拆解Karpathy对Anthropic预训练架构及算力成本的影响:从理论到降本实战
大语言模型的训练往往伴随着令人咋舌的GPU燃烧率。当研发团队试图复现或逼近顶尖模型的性能时,算力瓶颈往往成为最大的拦路虎。在众多技术先驱中,Andrej Karpathy 对神经网络底层的深刻洞察,为整个行业提供了宝贵的优化思路。探讨 Karpathy对Anthropic预训练架构及算力成本的影响,
AI 智能
1天前
1
2
3
…
110
下页
热门文章
深度解析DeepSeek V3.1-Terminus的技术演进与Agent雄心
2025-09-23 14:27:55
深度解析DeepSeek V3.2-Exp:DSA稀疏注意力与API成本革命
2025-09-30 14:46:00
许式伟发布 XGo 全景图:AI 时代的全民编程语言
2025-07-29 13:59:00
Grok 4 Fast vs GPT-5-mini:新一代高效AI模型开发者该如何选
2025-09-22 18:26:00
最近发布
vLLM与Ollama吞吐量差9倍,推理成本权衡
2026-05-25 10:27:25
通义千问2.5多模型接入实战指南:企业知识库场景的落地避坑与优化方案
2026-05-25 10:27:10
旧系统迁移Gemini3.5Flash架构延迟与成本
2026-05-25 10:26:57
老龄企业AI自动化系统架构选型与成本:打破传统工厂的智能化落地壁垒
2026-05-25 10:26:29
分类
企业出海
8
行业数字化
78
视联网
12
音视频营销
93
AI与智能服务
796
数据管理与存储
36
繁