斯坦福报告：2013年以来AI投资规模增长约40倍

发表2026.4.15

要点速览

斯坦福大学的《人工智能指数报告》是目前业界追踪AI发展轨迹最权威的参考之一。最新推出的2026年版报告横跨研究与开发、技术性能、负责任AI、经济影响、科学应用、医疗、教育等多个维度，汇聚了全球最新数据与洞察。
报告显示，2025年，AI产业开发了超过90%的前沿模型，其中一些模型在博士级别的科学问题、多模态推理和竞赛数学方面，其性能已达到甚至超越人类基准。
尽管AI能力正在跨越很多人类专属领域的边界，但这些模型的能力版图，呈现出一种深刻的”锯齿形”轮廓，例如有大模型读模拟时钟准确率仅只有一半。
报告称，通过并购、少数股权、私募投资及公开募股等方式，自2013年以来，AI相关投资规模增长了约40倍。消费者正在从他们经常免费使用的工具中获得巨大的价值。但是，三分之一的组织预计将在未来一年因为AI减少其员工人数。

斯坦福大学人工智能研究院（HAI）发布的《人工智能指数报告》年度报告，是目前全球追踪AI发展最系统、最具权威性的参考文献之一。最新推出的2026年版报告横跨研究与开发、技术性能、负责任AI、经济影响、科学应用、医疗、教育等多个维度。红杉汇梳理了报告中部分重要数据与洞察，以供各位读者参考。

研究与开发

报告显示，2025年，AI产业贡献了超过90%的知名模型，而这一趋势在过去十年持续强化，顶级工业实验室已成为前沿能力的核心产地，学术机构则更多扮演基础研究和人才供给的角色。

与此同时，闭源模型重新拉开领先优势。就在2024年8月，开源与闭源模型的性能差距一度缩小至0.5%，外界普遍预期开源生态即将实现反超。然而截至2026年3月，闭源模型重新领先了3.4%，Arena Leaderboard前10名中有6个仍为闭源模型。与此同时，开源生态的体量仍在高速扩张——GitHub上AI相关项目已达560万个，Hugging Face模型上传量较2023年增长3倍——但顶端的性能高地，依然由闭源把守。

报告称，最强大的模型正变得最不透明。在被追踪的95个知名模型中，80个未公开训练代码；OpenAI、Anthropic、Google等头部实验室均未披露参数数量、数据集规模或训练时长。2020年，仅4个著名模型未公开训练代码；而今这一数字已是当年的20倍。

此外，AI基础设施的扩张速度令人咋舌。全球AI计算容量已达1710万H100等效单位，自2022年以来年均增长3.3倍；数据中心功耗达到29.6GW，相当于整个纽约州的峰值电力需求。

技术表现

AI能力正在跨越一个又一个人类专属领域的边界。2025年，Google Gemini Deep Think在国际数学奥林匹克竞赛（IMO）中斩获金牌，以35分（达到金牌线）完赛——不借助任何特殊工具，在4.5小时竞赛时限内直接端到端作答，比2024年AlphaProof的银牌（28分）进一步跃升，彼时还需专家将题目翻译成形式语言Lean才能运算。在代码领域，顶级模型在SWE-bench Verified基准上的得分从约60%攀升至76.8%，逼近人类开发者基线。

AI Agent方面，OSWorld基准准确率从12%跃升至66.3%，距人类表现仅剩6个百分点。在博士级科学问题基准GPQA Diamond上，前沿模型平均准确率已达93%，超过人类专家验证基线12个百分点。

然而，这些模型的能力版图，呈现出一种深刻的”锯齿形”轮廓。在ClockBench测试中，当前最强模型GPT-5.4 High读取模拟时钟的准确率仅为50.6%，人类准确率为90.1%，中位误差达1至3小时（人类仅需约3分钟）。在机器人领域，这一反差更加极端：同一套系统在软件模拟环境中的操作成功率高达89.4%，在真实家务场景中跌至12%——受控环境里接近完美，真实世界里几乎失效。这也反映出了AI距离真正掌握物理世界还有很长的路要走。

顶级模型之间的性能差距，正在快速缩小。截至2026年3月，Arena排行榜前四名——Anthropic（1503分）、xAI（1495分）、Google（1494分）、OpenAI（1481分）——聚集在25个Elo分以内。当能力差异缩小到这一量级，竞争的核心已悄然从”谁更聪明”转向”谁更便宜、更可靠、在特定领域更专精”。AI正在经历一个隐性的商品化进程。

能力的狂奔，也带来了环境成本的急剧攀升。训练Grok 4产生的碳排放达到72,816吨二氧化碳当量；GPT-4o年度推理用水量，可能超过1200万人全年的饮用水需求。性能在趋同，但能耗的分化，正在成为衡量模型效率的新战场。

经济影响

报告显示，通过并购、少数股权、私募投资及公开募股等方式，自2013年以来，AI相关投资规模增长了约40倍。2025年总投资额达到5816.9亿美元，较上年增长129.9%。其中私募投资以3446.6亿美元占据最大份额，较2024年增长127.5%。并购活动同样呈现132.6%的同比增长。尽管投资结构逐年变化，企业正持续加大资本投入以强化其AI能力与市场地位的态势已非常明确。与此同时，AI公司的收入正以历史性的速度增长，而计算成本和基础设施支出也达到了创纪录的水平。

生成式AI的普及速度，正在刷新技术扩散的历史记录。从推出到覆盖全球53%人口，生成式AI仅用了约3年时间——远快于个人电脑和互联网的扩散曲线。组织层面的采用率已达88%。截至2026年初，AI工具对美国消费者创造的年度估计价值达到1720亿美元，中位用户所感知的价值在一年内增长了3倍。这在很大程度上来自免费或低价工具的广泛渗透，用户在不知不觉中已将AI嵌入了日常工作流。

在客户支持和软件开发领域，AI带来的生产率提升已有14%至26%的实证数据支撑。然而，在生产率收益最显著的软件开发领域，2024年22至25岁美国入门级开发者的就业人数下降了近20%。三分之一的组织预计将因为AI在未来一年减少其员工人数，尽管大规模的失业尚未在整体就业数据中显现出来。生产率的收益与初级岗位的萎缩，出现在同一个行业、同一个时间窗口——两者之间的相关性，值得持续关注。

医疗和教育

AI正在改变医生的临床工作流。2025年，从患者问诊自动生成临床笔记的AI工具获得了大规模采用。医生反馈，使用这类工具后，花在书写记录上的时间减少了高达83%，同时显著缓解了职业倦怠。然而，报告对超过500项临床AI研究的系统审查发现，近半数研究依赖标准化问题，而非真实患者数据；仅有5%的研究采用了真实临床数据作为评估基础。

在教育领域，学生对AI工具的使用，已远跑在教育机构前面。超过80%的美国高中生和大学生将AI用于与学校相关的任务；然而仅有50%的中学和高中制定了AI相关规定，更关键的是，在有相关规定的学校中，只有6%的教师认为这些规定是清晰可操作的。

此外，对于AI的未来，专家与普通人之间存在一道50个百分点的认知鸿沟。73%的AI专家预期AI对工作方式将产生积极影响，而持相同看法的普通人仅有23%。类似的分歧延伸至经济影响和医疗健康领域。两个群体看到的，可能本来就是AI影响的不同侧面：专家更多看到生产力的边界被推进，普通人更直接感受到就业和生活的不确定性。