发布日期:2025-08-24 06:35 点击次数:75
4月8日,由李飞飞聚拢设备的斯坦福大学以东谈主为本东谈主工智能询查所(Stanford HAI)发布了《2025年东谈主工智能指数发挥》(Artificial Intelligence Index Report 2025)。这份长达456页的发挥,深刻理会了2024年环球东谈主工智能行业的发展态势,揭示了12摧毁道趋势。
图片起原:斯坦福大学以东谈主为本东谈主工智能询查所官网
发挥觉得,AI正变得更高效、更普惠。跟着小模子性能飙升,达到GPT-3.5水平的系统推理本钱在以前两年间着落到了正本的280分之一。
发挥还指出,中国高性能AI模子的数目和质料不停提高,中好意思AI模子性能近乎执平。与此同期,中国在AI鸿沟论文数目和专利数目上保执滥觞地位。
AI性能飙升,推崇渐渐接近东谈主类
2023年,询查东谈主员推出了MMMU、GPQA和SWE-bench等颇具挑战性的新基准测试,用于测试AI系统的极限。
测试发现,只是一年后,AI系统的性能便终了大幅跃升——在MMMU测试中得分提高18.8个百分点;在GPQA测试中提高48.9个百分点;SWE-bench测试里更是提高了67.3个百分点。
从合座趋势来看,AI在各大鸿沟的推崇渐渐接近东谈主类,以至在某些情形下,AI智能体能在限时编程任务中超过东谈主类。
在部分评测认识上,AI期间性能推崇与东谈主类水平的对比图片起原:《2025年东谈主工智能指数发挥》
磋议词,复杂的推理关于AI模子而言,仍然是一个挑战。
在处理雷同外洋数学奥林匹克竞赛题目这类任务时,AI模子推崇出色。但靠近诸如PlanBench等复杂推理基准测试时,却仍显得繁忙。即使靠近那些已知存在正解的逻辑任务,AI也往往无法可靠地科罚逻辑任务,这极大适度了AI在对精度条目极高的高风险行业中的利用。
各大模子在PlanBench基准测试上的正确率 图片起原:《2025年东谈主工智能指数发挥》
环球AI投资飙升
2024年,生成式AI在环球范围内勾引了339亿好意思元的私东谈主投资,与2023年比较,增长幅度达到18.7%。
与此同期,企业对AI的领受率显耀提高,从2023年的55%飞腾至2024年的78%。越来越多的询查驱散标明,AI不仅梗概有用提高出产力,在大宗情况下,还能消弱劳能源的技巧差距。
值得柔软的是,将生成式AI利用于至少一项业务职能的企业数目出现了激增。2023年,这一比例仅为33%,而到了2024年,该比例跃升至71%,增幅滥觞一倍。
2017年至2024年,将AI利用于至少一项业务职能企业的比例不停飞腾 图片起原:《2025年东谈主工智能指数发挥》
中好意思模子性能近乎执平
数据清晰,好意思国在AI模子的数目上处于滥觞地位。2024年,总部位于好意思国的机构领有40个知名AI模子,滥觞中国(15个)和法国(3个)。
图片起原:《2025年东谈主工智能指数发挥》
不外,发挥强调,中好意思模子之间的性能差距正在飞快消弱。以MMLU和HumanEval等主流基准测试驱散来看,2023年,中好意思顶尖模子之间的性能差距还在两位数,磋议词到了2024年,这一差距已大幅消弱,果然处于合并水平。
与此同期,中国在AI鸿沟论文数目和专利数目上依旧保执滥觞地位。
小模子性能飙升,推理本钱降至280分之一
发挥指出,AI正变得愈加高效、经济实惠和易于取得。
跟着小模子性能提高,达到GPT-3.5水平的系统推理本钱在以前两年间着落至280分之一。在硬件层面,本钱每年着落30%,而能源驱散每年提高40%。
2022年,在MMLU基准测试中,得分超60%的最小模子是PaLM,参数目为5400亿。到了2024年,微软Phi-3-mini仅用38亿参数,就取得了雷同的实力。这代表,两年多的时候里模子参数减少了142倍。
此外九游会体育,开源模子正在奋发图强,与闭源模子的差距渐渐消弱。2023年,开源模子清爽过时于闭源模子。而到2024年,这一差距果然袪除。2024年1月初,顶尖闭源模子在大模子竞技场排名榜上以8.0%的收获滥觞了顶尖开源模子。而到2025年2月,这一差距已消弱至1.7%。
2022年至2024年,在MMLU上得分高于60%的小模子 图片起原:《2025年东谈主工智能指数发挥》
中国对AI的派头最乐不雅
在对AI的派头方面,中国事环球主要国度和地区中最乐不雅的。
发挥清晰,2024年中国有83%的东谈主觉得AI家具和劳动利大于弊,排在背面的是印度尼西亚(80%)和泰国(77%)。比较之下,好意思国(39%)、加拿大(40%)等的乐不雅情态远低于中国。
2022年至2024年,列国觉得“使用AI家具和劳动利大于弊”的比例 图片起原:《2025年东谈主工智能指数发挥》
不外,从合座趋势而言,列国关于AI的乐不雅情态正渐渐升温,颠倒是在一些曾对AI最执怀疑派头的国度。数据清晰,自2022年起,好意思国觉得“使用AI家具和劳动利大于弊”的比例提高了4%,加拿大增长了8%,法国增长了10%。
三分之二受访者称AI将在将来3至5年对往往生涯产生显耀影响
从医疗保健到交通输送,AI正飞快从实验室走向往往生涯。
2023年,好意思国食物药品监督经管局(FDA)批准了223款AI医疗建树,而2015年仅有6款。
1995年至2023年FDA批准的AI医疗建树数目 图片起原:《2025年东谈主工智能指数发挥》
谈路交联接样因AI期间发生着日眉月异的变化。自动驾驶汽车不再只是实验,而是冷静驶入践诺生涯。
好意思国最大的运营商之一Waymo每周提供滥觞15万次自动驾驶劳动,而百度旗下的“萝卜快跑”(Apollo Go)无东谈主驾驶出租车队已在中国多个城市正经参加运营。
此外,东谈主们对AI融入往往生涯的期待与招供度正在飞腾。据统计,环球范围内,有多达三分之二的受访者觉得,在将来三到五年内,AI家具及劳动将对往往生涯产生显耀影响。