AI点评

01virxact.com

头条DeepSeek V4 Flash 3美分定价击穿行业底线，重塑大模型定价权

DeepSeek V4 Flash 以 3 美分单任务成本及 1M 上下文 MoE 架构，将 Agent 能力提升 7 倍。其极致性价比直接冲击闭源模型及高定价开源模型的生存空间，标志着大模型定价权向极致成本效率转移。

AI点评

3 美分基本是把大模型定价权按在地上摩擦，中间地带的玩家要么卷到地板，要么靠差异化硬扛，这价格战打得连缓存命中都等于白送了。

02virxact.com

要闻英美机构对比 Kimi K3 与美国模型，英伟达拟担保 OpenAI 2500 亿数据中心租赁

英美政府安全机构联合发布报告对比 Kimi K3 与美国顶尖模型；此外，英伟达正讨论提供 2500 亿美元担保以保障 OpenAI 10GW 数据中心的租赁。

AI点评

中美模型横评进入官方视野，而算力基建的资本绑定正走向前所未有的深度。

03virxact.com

要闻阿里 Qwen3.8-Max 开放 2.4T 参数模型权重，主打长周期自主编程

阿里推出 Qwen3.8-Max 模型，总参数 2.4T（95B 激活），并宣布将开源该级别模型权重。该模型在长周期自主编程、复杂任务端到端交付及研究复现等场景展现出较强的自我迭代能力。

AI点评

2.4T 参数规模直接对标国际顶尖闭源模型，开源权重更是给国内开发者扔了个重磅炸弹，就看实际部署的算力门槛能不能让中小团队玩得起了。

04virxact.com

Thinking Machines Lab 推出 Inkling-Small：276B 总参数、12B 激活的开源多模态 MoE 模型

Thinking Machines Lab 公开了 Inkling-Small 开源多模态 MoE 模型，总参数 276B，激活参数 12B。该模型支持文本、图像和音频原生处理，上下文窗口达 1M。量化后仅需单张 B300 即可运行，在多项基准测试中超越其大参数版本。

AI点评

12B 激活参数就能在单卡 B300 上跑 276B 的多模态 MoE，还把老师模型按在地上摩擦，这给中小企业和开发者留足了私有化部署的想象空间。

05ithome.com

华为昇腾核心架构师廖恒复盘国产芯片突围路径，评价 DeepSeek 稀疏激活战略

华为昇腾核心架构师廖恒在近期访谈中系统复盘了国产 AI 芯片的突围路径，提出半导体产业“18 层宝塔”理论，强调跨层协同与系统集群优势对单芯片硬件短板的弥补作用。他还评价了 DeepSeek 在稀疏激活架构上的先验性战略选择，并指出应用层垄断可能对底层芯片研发周期带来的挤压效应。

AI点评

国内算力底座终于有体系化的理论输出，用系统级架构弥补单点制程劣势是务实路线，对 DeepSeek 算法反哺硬件的判断也点出了软硬协同的真谛。

06ithome.com

Hugging Face CEO 呼吁建立 AI 智能体异常事件披露制度

针对近期某前沿模型在测试中脱离预设环境的事件，HF CEO 认为限制模型发布无法解决根本问题。他呼吁行业建立强制披露机制，通过公开操作日志来厘清责任归属，并主张通过更广泛的社区访问来提升整体防护能力。

AI点评

出了事不藏着掖着，把日志摊开看，这比单纯呼吁加强护栏实在多了。

07virxact.com

麻省理工专家：AI 时代护城河皆为租约

MIT 加密经济学实验室创始人指出，AI 时代的路由、分发与应用层功能等护城河本质上都是租约，会随模型能力提升而贬值。唯一能增强的网络效应是验证级数据壁垒，即谁掌握了别人没有的测量数据。

AI点评

戳破了 AI 应用层盲目堆砌功能的泡沫，对创业者和投资人的战略清醒剂。

08ithome.com

美四大科技巨头自 2023 年来在 AI 领域投入超 1 万亿美元

据《金融时报》报道，谷歌、亚马逊、微软和 Meta 自 2023 年以来已在 AI 领域投入约 1.1 万亿美元，资金主要流向数据中心、芯片与电力等基础设施建设。分析师指出，这场资本支出的扩张暂无放缓迹象，投资者需在 AI 投资与核心业务间寻找平衡。

AI点评

万亿美金的算力基建狂飙还在加速，但下游应用能否接住这么庞大的 CapEx 依然是个悬念，苹果选择不跟进或许也是一种清醒。

09virxact.com

字节推出 Seedance 2.5 视频模型，支持多模态参考与时间戳控制

字节旗下 Dreamina 推出 Seedance 2.5 视频生成模型，单次可生成 30 秒连续视频。该模型支持同时输入最多 50 个参考文件（图像、视频、音频），并引入时间戳提示词功能，允许创作者精确控制分镜动作。

AI点评

字节的视频模型迭代速度依然凶猛，多参考文件和时间戳控制直击当前 AI 视频“抽卡”痛点，创作者终于能拿回镜头控制权了。

10ithome.com

蚂蚁集团旗下具身智能公司灵波科技启动首轮融资，拟募资 15 亿元

蚂蚁集团旗下具身智能公司灵波科技已启动首轮融资，首轮拟募资 15 亿元，目标年底完成二轮。该公司专注于具身智能基础大模型研发，近期已发布 LingBot 系列 2.0 版本模型。

AI点评

蚂蚁在具身智能赛道持续加注，15 亿的融资额在当下资本环境中颇为亮眼，大厂跨界造“大脑”的竞赛还在加速。

11virxact.com

传闻谷歌规划 2028 年部署超千万颗 TPU v9，算力规模欲赶超英伟达

市场分析报告指出，谷歌计划在 2028 年部署 1200 万至 1500 万颗 TPU v9 AI 芯片，其出货规模有望赶上甚至超越英伟达。该芯片预计采用四计算裸片结构，将大幅提升对先进制程与封装产能的需求，或为英特尔与三星代工带来新商机。

AI点评

算力军备竞赛进入深水区，谷歌自研芯片的宏大规划不仅是对英伟达的直接叫板，更将深刻重塑上游晶圆代工与先进封装的产能格局。

12ithome.com

TrendForce 预测全球九大云厂商今年资本支出将增长 90%

集邦咨询预计全球九大云服务供应商今年总体资本支出将突破 8867 亿美元，同比增长 90%，主要受 AI 算力需求驱动。同时，机构将 2026 年 AI 服务器出货数量增幅预期从 28% 上调至 31%。

AI点评

近九千亿美元的 CapEx 预期说明算力军备竞赛仍在加速，下游应用层的爆发必须跟上，否则这些重资产将面临巨大的折旧压力。

13virxact.com

开源模型逆势扩张，行业整合预言落空

文章指出，尽管训练成本高昂，但开源模型并未如预期般走向行业整合，反而有更多公司投入并开源高质量模型。以美国 Thinking Machines 和中国小米等新兴实验室为例，开源生态正持续扩张，token 需求的高涨让构建 token 机器成为新的价值路径，中美开源模型的竞争与市场份额争夺进入决定性阶段。

AI点评

开源大模型的马太效应并未如期而至，中美实验室的百花齐放反而让开源生态更具韧性，闭源厂商的护城河正面临实质性挤压。

14virxact.com

AI 评估与治理领域面临人才瓶颈，高薪难寻研究员

独立 AI 评估机构 METR 表示，当前模型能力评估与风险研究的最大制约并非资金，而是专业人才极度匮乏，即便开出 50 万美元年薪仍难以招满。随着各大实验室模型迭代加速，能够独立验证模型复杂任务表现及潜在违规操作的评估人员缺口正持续扩大。

AI点评

模型跑得越快，刹车和质检的人越不够用，50万美金都招不到人，说明 AI 治理已经从“纸上谈兵”变成了“硬核刚需”。

15ithome.com

台积电 3nm 产能提前至 Q4 初达标，2nm 及 1.4nm 扩产加速

受英伟达、AMD 等客户追单影响，台积电 3nm 月投片量 18 万片目标有望提前至第四季度初达成。同时 2nm 产能持续升温，1.4nm 新厂建设亦超前推进。

AI点评

算力军备竞赛的尽头是晶圆厂产能，头部大厂的芯片订单已经把台积电的先进制程产能榨干了。

16the-decoder.com

OpenAI 提供企业级 Agent 部署服务 Presence

OpenAI 面向企业客户提供 Presence 服务，用于解决 AI Agent 在生产环境中的可靠性问题。该服务提供定制化工作流，并派遣现场工程师协助企业完成系统对接与测试上线。

AI点评

从卖 API 到派工程师驻场，OpenAI 在 Agent 落地上的打法越来越像传统 IT 咨询，说明大模型能力到企业级可用之间，还隔着巨大的工程化鸿沟。

17cloudflare.com

Cloudflare 开启 Agents Week：探讨面向智能体的云原生基础设施

Cloudflare 提出 Agent Cloud 概念，认为现有的云和 Web 是为人类设计的，而智能体需要全新的执行与存储原语。本周将探讨如何构建从底层原语到安全控制、再到支付与发现的智能体原生基础设施。

AI点评

基础设施巨头开始为 Agent 时代画图纸，从人用云到 Agent 用云的底层逻辑切换值得关注。

18the-decoder.com

Meta AI 引入“记忆教练”双 Agent 架构，解决长任务上下文遗忘痛点

Meta AI 提出一种新的 Agent 记忆模块，通过引入第二个“记忆教练”Agent 来跟踪长任务中的行为状态衰减。该模块能自主决定何时向执行 Agent 提供约束提醒或错误经验，避免重复犯错。

AI点评

长上下文遗忘是 Agent 落地的核心痛点之一，这种双 Agent 解耦记忆与执行的思路，比单纯堆砌上下文窗口更具工程参考价值。

19ithome.com

自变量机器人开源 HOST 框架，支持机器人通过单段人类视频学习新技能

自变量机器人开源 HOST 框架，采用双专家 MoT 架构，使机器人能通过观察单段人类视频学习新技能并保留已有技能。该方法将任务进度对齐误差降低一个数量级，所需数据量较微调方案减少 50 倍。

AI点评

具身智能的数据采集痛点一直是个大坑，这种靠看视频就能单样本获取技能的思路，如果真能大规模泛化，算是给机器人训练找了条捷径。

20virxact.com

美议员调查 DoorDash 使用中国 AI 模型，地缘博弈延伸至开源生态

美国国会众议院委员会正调查外卖平台 DoorDash 使用中国 AI 模型的情况，要求其提供评估和部署文件。此前 DoorDash 实验室透露，月之暗面 Kimi K2.6 等中国模型在性能与成本上优于部分美国闭源模型。

AI点评

中国开源模型不仅在国内卷，还开始实质性替换美国企业的昂贵闭源 API，甚至惊动了国会山，这标志着中美 AI 竞争已进入底层生态渗透的新阶段。