今年7月,彭博社对阿里云创始人王坚进行了一次访谈,当时王坚还有另一重身份,之江实验室主任。
之江实验室是浙江省为基础技术研究和攻关建设的前沿阵地,2021年被纳入了国家实验室体系,作为继云计算之后的又一项进入社会议题的重要基础技术,人工智能自然也在之江实验室研究之列。
曾经,王坚是国内最大一朵云——阿里云的缔造者,如今,王坚再次站到了人工智能技术漩涡中央,本质上是当代“工业革命”,或者说是技术革命的一次延续。
“因为互联网的存在,我确信云计算是一项好业务,而互联网将数据聚集到一起,也让我坚信,数据会从根本上改变商业模式。
但我当时没有意识到的是,计算、数据、模型结合在一起会创造出人工智能,会再次改变我们做生意的方式,也没有想到,人工智能会成为云计算最大的‘客户’。”
当然,王坚更不会想到的是,它年之后,人工智能会在短短几天内为阿里云带来3600亿市值。
2019年3月27日,2018年图灵奖名单公布,在这一届图灵奖得主中,最引人注目的是“深度学习三巨头”——杰弗里·辛顿、约书亚·本吉奥和杨立昆。
辛顿的人工智能技术成果曾在2013年以4400万美元的高价竞拍给了谷歌,辛顿也随之一起投效了谷歌,当时参与这场竞拍的还有微软、百度。
后知后觉的Meta后来是三顾茅庐请了杨立昆出山,来为Meta的人工智能战略坐镇。
学术大佬的坐镇对于科技巨头有诸多好处,诸如这些学术大佬手中技术成果商业转化的优先权,以及这些学术大佬的名气和人脉带来的人才资源。
当然,由于在美国这些科技巨头中拥有至高话语权,这些学术大佬往往也会将自己的学术习惯带到公司中,杨立昆为Meta带来的一个“学术习惯”是,开源。
2022年11月30日,ChatGPT的问世将人工智能拉入了大模型范式,也让人工智能进入到了OpenAI时刻。
OpenAI一骑绝尘,投资了OpenAI的微软成了最大的赢家,谷歌依旧是美国顶级科学家的大本营,而且还是Transformer架构的提出者。
在杨立昆的影响下,Meta在人工智能领域走了另一条技术路线月,Meta发布了自己的Llama 1,这是Meta发布的第一个大模型,一个开源大模型。
以Meta为代表的开源路线两条技术路径。在国内,承袭了开源技术路线月,阿里首次对外发布两款开源大模型QWen-7B和QWen-7B-Chat,通过小参数模型,阿里开始试水大模型开源路线。
一家是在2013年收购辛顿DNNresearch未果的百度,百度后来在国内广泛招揽AI人才,在2014年重组深度学习研究院为百度研究院,确立了AI战略。
2023年3月16日,百度召开新闻发布会,发布了文心一言,百度CEO李彦宏自豪地称,“百度是全球大厂中第一个发布大模型的厂商。”
实际上,互联网巨头在技术领域往往秉持的是广撒网模式,国内几家大厂的实验室中其实早早就有在跟进大模型这条技术路径,也早早就有了技术雏形,只是大家不确定该All in哪条路线,以及人工智能何时到来。
”的暂定格局收尾,其中标志性事件是零一万物部分团队并入阿里,李开复公开表示,“只有大公司能继续做超大模型(教师模型)。”
另一头是互联网巨头的基模不断刷榜后,开始挺进商业世界。阿里的开源大模型是在Qwen2.5、尤其是2025年1月的Qwen2.5 Max发布后,开始在产业中体现出商业价值。
02 押注AI,像押注云计算一样2024年是中国大模型发展最快的一年,也是烧钱最快的一年。
就业务从属关系来看,阿里将大模型产品放到了与之高度相关的云业务体系中,这其中一个关键考量自然是大模型产品的应用与云计算资源消耗高度挂钩,“
”已经成为一个主流观念。尤其是在吴泳铭接棒阿里CEO的2023年,为阿里云定调“AI驱动、公共云优先”战略后,阿里云开始向AI云转变。
以最为关键的基模模型能力来看,在2024年云栖大会上发布的Qwen2.5 72B开源大模型,部分性能已经超越了Meta同期发布的Llama 3.1 405B大模型,这款大模型也被周靖人称为“最强开源模型”。
与此同时,阿里云还上线了用于模型训练和部署的人工智能平台PAI、用于企业级大模型开发的百炼平台,搭建了用于训练模型的十万卡级灵骏智算集群,研发了用于模型推理的平头哥系列芯片……后来阿里云一再强调打造了全栈AI体系,芯片、算力九游娱乐 九游娱乐官方集群、平台工具、通用基础大模型,正是其中关键的几个环节。
关于降价,阿里云CTO周靖人在2024年9月的一次采访中曾专门做出过回应:
“今天大模型的创新、迭代和运用依然处于早期阶段,如果推理成本昂贵,大量开发者就无法有效、规模化使用大模型,大模型的能力需要让大家用得起……
……我不认为这是价格战,我们的大模型降价主要通过技术优化来实现,通过规模效应、技术进步和资源调度将成本进一步降低……”
而转年进入2025年、大模型应用落地元年后,阿里云再次加快了推进AI战略的脚步,我们能够看到的是:曾经帮助阿里推广了云计算的
,开始在各个城市推广阿里云的全栈AI、大模型能力,以及已经打造出的阿里云大模型应用标杆企业的标杆案例;更为直观的是,曾经朗朗上口的“上云就上阿里云”的广告词,在这一年也化身为“AI就用阿里云”,出现在了各大机场最显现的位置。
9月3日,Anthropic官宣完成130亿美元F轮融资,投后估值1830亿美元(约1.3万亿元),全球人工智能领域由此迎来了第三家万亿估值独角兽公司。Anthropic是由OpenAI前员工在2021年创立,和OpenAI并称为全球基模领域两大AI独角兽公司。
或许有人会觉得遗憾,国内经过百模大战后,也未能跑出一家像上述两家一般的基模创业公司,基模最终仍是被互联网巨头秋风扫落叶后收入囊中。
如果将人工智能视为堪比互联网的跨时代技术周期,在人工智能被写入政府工作报告、成为国家战略级新兴产业后,国内人工智能产业基本由深层到浅层可以按数据、算法、应用被划归为三大环节,这其中:
,由新成立的数据集团统一管理,北京数据集团就在2025年7月正式成立;最基础的
,最终会由几家人工智能巨头提供,显然,阿里云正在从互联网巨头过渡到人工智能巨头;
最广泛的人工智能应用,更像是互联网时代各种门类的App,这正是中国创业团队擅长的地方,各种智能体正在中国市场孵化中。
通用基础模型已经足够支撑第一波商业化应用落地,我们正在进入一个由通用基础模型“教”出的小参数模型支撑各类智能硬件、催生智能体和智能应用的阶段。
甚至,王坚“并不认为在AI领域,如今拥有的任何优势,会成为别人无法追上的障碍。”