2026年6月23日注定会被记入科技史。同一天里,三件事像多米诺骨牌一样接连倒下:Oracle宣布过去十二个月裁员21000人并把锅甩给”AI替代”;成立仅八个月的AI记忆初创公司Engram宣布拿下9800万美元融资;纳斯达克单日下跌2.2%,韩国KOSPI从历史高点回撤超过10%,一场由AI担忧驱动的全球科技股抛售横扫华尔街和亚洲市场。
把这三件事摆在一起看,比单看任何一条都更刺眼。它把AI时代最尖锐的张力——资本狂热与就业阵痛、算力堆砌与效率突破——一次性铺开在我们面前。
先看Oracle的账本。财报显示,这家老牌数据库巨头把员工总数从162000人砍到141000人,重组费用高达18.4亿美元,同期资本开支却飙到500亿美元级别,同比增长超过一倍。换句话说,Oracle一边在用AI重写自己的工作流、裁掉被认为可以被替代的白领岗位,一边把省下来的钱和融来的钱全部砸向AI数据中心和云基础设施。这种”裁人换算力”的逻辑,在SaaS行业里被分析师戏称为”SaaSpocalypse”。
再看市场的反应。投资者突然意识到一个问题:所有云厂商都在重复同一件事——借钱、裁人、买GPU、扩数据中心——可下游究竟有多少真实需求能撑起这个开支节奏?于是抛售从SpaceX蔓延到英伟达供应链,从甲骨文蔓延到韩国存储芯片,Bridgewater的Ray Dalio公开喊出”AI泡沫终将破裂”。这不再是某一家公司的问题,而是整个AI资本循环第一次遭遇真正意义上的”需求侧证伪”质疑。
效率派的反攻:Engram们押注的不是更大的模型
就在恐慌情绪最浓的当口,Engram带着9800万美元融资高调出场。这家由Dan Biderman创立、团队来自斯坦福、伯克利和康奈尔的初创公司,估值已经冲到6亿美元。它的故事并不性感——不做更大的基础模型,不做更花哨的多模态,而是死磕一件事:AI的记忆层。在他们看来,大模型每次推理都把全部历史塞进上下文窗口,是巨大的浪费。
Gartner三月份的报告给出了一个令人警醒的数字:智能体(Agent)模型在执行任务时消耗的token数量,是普通聊天机器人的5到30倍。这意味着随着AI Agent走向生产环境,token成本会以非线性速度膨胀。Engram的方案是给模型装上一层”外接大脑”——把长期记忆从GPU搬到更便宜的DRAM和检索系统上,让模型只读取当下真正需要的信息。如果这条路走通,单次推理成本有可能下降一个数量级。
这恰恰是泡沫论的反面:当所有人都在赌”算力越大、模型越强”时,Engram押注的是”算力越省、产品越便宜”。前者是供给侧的故事,后者是需求侧的故事;前者需要不断烧钱维持稀缺性,后者则把AI从奢侈品拉回日用品。
把视角拉远一点,这其实是整个科技行业正在分化的两条路。一条是Oracle、微软、谷歌、Meta走的重资产路线——堆数据中心、堆GPU、堆资本开支,把AI变成新型基础设施生意。另一条是Engram、以及大量围绕推理优化、模型压缩、缓存系统、检索增强生成创业的小公司走的轻资产路线——把每一次推理都做得更便宜,让AI可以被中小企业和普通开发者用得起。
这两条路并不矛盾,但它们对资金的需求、对就业的冲击、对估值的支撑逻辑完全不同。重资产路线天然会带来裁员潮,因为它用机器替代白领、用资本替代人力;轻资产路线则会创造新的工程师岗位和创业机会,因为它降低的是门槛而不是需求。Oracle的21000人不会凭空消失,但Engram的9800万美元背后,可能站着未来三年里上百家类似的效率型公司。
所以2026年6月23日这一天的真正意义,不是科技股跌了多少,也不是哪家云厂又裁了多少人。它是市场第一次被迫回答一个长期被回避的问题:AI究竟是稀缺品还是日用品?如果是稀缺品,那现在的资本开支就是合理的泡沫;如果是日用品,那Engram们的效率革命才刚开始,谁拥有最低的推理成本,谁就拥有下一个十年的定价权。
答案或许还没揭晓,但方向已经清楚——这场泡沫与革命的赛跑,会决定未来十年科技行业的全部格局。