4月8日,由李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)发布了《2025年人工智能指数报告》(Artificial Intelligence Index Report 2025)。这份长达456页的报告,深入剖析了2024年全球AI行业的发展形态趋势,揭示了12大关键趋势。
报告认为,AI正变得更高效、更普惠。随着小模型性能飙升,达到GPT-3.5水平的系统推理成本在过去两年间下降到了原来的280分之一。
报告还指出,中国高性能AI模型的数量和质量不断的提高,中美AI模型性能近乎持平。与此同时,中国在AI领域论文数量和专利数量上保持领先地位。
2023年,研究人员推出了MMMU、GPQA和SWE-bench等颇具挑战性的新基准测试,用于测试AI系统的极限。
测试发现,仅仅一年后,AI系统的性能便实现大幅跃升——在MMMU测试中得分提升18.8个百分点;在GPQA测试中提高48.9个百分点;SWE-bench测试里更是提升了67.3个百分点。
从整体趋势来看,AI在各大领域的表现逐渐接近人类,甚至在某些情形下,AI智能体能在限时编程任务中超越人类。
在部分评测指标上,AI技术性能表现与人类水平的对比 图片来自:《2025年人工智能指数报告》
在处理类似国际数学奥林匹克竞赛题目这类任务时,AI模型表现出色。但面对诸如PlanBench等复杂推理基准测试时,却仍显得吃力。即使面对那些已知存在正解的逻辑任务,AI也经常无法可靠地解决逻辑任务,这极大限制了AI在对精度要求极高的高风险行业中的应用。
各大模型在PlanBench基准测试上的正确率 图片来源:《2025年人工智能指数报告》
2024年,生成式AI在全世界内吸引了339亿美元的私人投资,与2023年相比,增长幅度达到18.7%。
与此同时,企业对AI的采用率明显提升,从2023年的55%上升至2024年的78%。慢慢的变多的研究根据结果得出,AI不仅仅可以有效提升生产力,在多数情况下,还能缩小劳动力的技能差距。
值得关注的是,将生成式AI应用于至少一项业务职能的公司数出现了激增。2023年,这一比例仅为33%,而到了2024年,该比例跃升至71%,增幅超过一倍。
2017年至2024年,将AI应用于至少一项业务职能企业的比例一直上升 图片来自:《2025年人工智能指数报告》
数据显示,美国在AI模型的数量上处于领头羊。2024年,总部在美国的机构拥有40个知名AI模型,超过中国(15个)和法国(3个)。
不过,报告强调,中美模型之间的性能差距正在迅速缩小。以MMLU和HumanEval等主流基准测试结果来看,2023年,中美顶尖模型之间的性能差距还在两位数,然而到了2024年,这一差距已大幅缩小,几乎处于同一水平。
随着小模型性能提升,达到GPT-3.5水平的系统推理成本在过去两年间下降至280分之一。在硬件层面,成本每年下降30%,而能源效率每年提高40%。
2022年,在MMLU基准测试中,得分超60%的最小模型是PaLM,参数量为5400亿。到了2024年,微软Phi-3-mini仅用38亿参数,就取得了同样的实力。这代表,两年多的时间里模型参数减少了142倍。
此外,开源模型正在迎头赶上,与闭源模型的差距逐渐缩小。2023年,开源模型明显落后于闭源模型。而到2024年,这一差距几乎消失。2024年1月初,顶尖闭源模型在大模型竞技场排行榜上以8.0%的成绩超过了顶尖开源模型。而到2025年2月,这一差距已缩小至1.7%。
2022年至2024年,在MMLU上得分高于60%的小模型 图片来自:《2025年人工智能指数报告》
报告显示,2024年中国有83%的人认为AI产品和服务利大于弊,排在后面的是印度尼西亚(80%)和泰国(77%)。相比之下,美国(39%)、加拿大(40%)等的乐观情绪远低于中国。
2022年至2024年,各国认为“使用AI产品和服务利大于弊”的比例 图片来自:《2025年人工智能指数报告》
不过,从整体趋势而言,各国对于AI的乐观情绪正逐渐升温,特别是在一些曾对AI最持怀疑态度的国家。多个方面数据显示,自2022年起,美国认为“使用AI产品和服务利大于弊”的比例提升了4%,加拿大增长了8%,法国增长了10%。
2023年,美国食品药品监督管理局(FDA)批准了223款AI医疗设施,而2015年仅有6款。
1995年至2023年FDA批准的AI医疗设施数量 图片来自:《2025年人工智能指数报告》
道路交通同样因AI技术发生着日新月异的变化。无人驾驶汽车不再只是实验,而是逐步驶入现实生活。
美国最大的运营商之一Waymo每周提供超过15万次无人驾驶服务,而百度旗下的“萝卜快跑”(Apollo Go)无人驾驶出租车队已在中国多个城市正式投入运营。
此外,人们对AI融入日常生活的期待与认可度正在上升。据统计,全世界内,有多达三分之二的受访者认为,在未来三到五年内,AI产品及服务将对日常生活产生显著影响。
如需转载请与《每日经济新闻》报社联系。未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。
特别提醒:如果个人会使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。
李飞飞团队“50美元”复刻DeepSeek-R1?一文读透“白菜价”背后的真正逻辑
做空英伟达的又一理由?蚂蚁集团发布最新AI成果:无需高端GPU,计算成本降低20%,训练1万亿Token只需508万元
李飞飞团队最新报告:中美AI模型性能近乎持平;“3天5货机”!苹果上演关税“大逃亡”丨全球科学技术早参
突发!特朗普最新签令!英伟达盘后大跌,市值蒸发1.2万亿元!美股遭大规模抛售,华尔街大佬集体警告,基金经理们“相当悲观”
增长940%,突然爆火!苹果商店排名飙升至第二,特朗普关税下,美国人正大量下载这款中国App:堪称“省钱利器”
国家部委工作人员张某(女),疯狂窃密,携海量内部文件叛逃时被控制,将被严惩!详情披露
中国地震台网正式测定:04月16日02时05分在广东汕尾市陆丰市(北纬22.83度,东经115.85度)发生3.0级地震
崩了!美国进口订单量下跌64%!最新业内调查:特朗普的关税不会使供应链回流到美国
美媒惊叹:“中国向巴西迅速下单,购买潮异常大”!中国市场缩水严重,美国农民喊苦:我曾投票给特朗普,现在请他结束冲突
新闻推荐
【2025-04-20】
【2025-04-19】
【2025-04-19】
【2025-04-19】
【2025-04-19】
【2025-04-17】
【2025-04-17】
【2025-04-16】
【2025-04-16】
【2025-04-15】
【2025-04-15】
【2025-04-14】