李飞飞站队LeCunAGI全是炒作！80分钟重磅爆料出炉

日期：2025-11-17 浏览：　

　　重磅访谈放出，从AI革命兴起到下一个智能前沿——具备空间智能的世界模型。一场访谈，可以窥见AI教母关于AI未来的深刻洞察。

　　二十年前，李飞飞主导创建的ImageNet，像一束火种，彻底点燃了深度学习的革命。

　　如今，AI热潮席卷全球，她坚信「世界模型」才是未来十年AI的下一个前沿。

　　就在今天，李飞飞在Lenny Rachitsky的新一期播客中，回顾了AI从寒冬如何走到了今天这一步。

李飞飞站队LeCunAGI全是炒作！80分钟重磅爆料出炉(图1)

　　大概在九到十年前，自称AI公司的无异于「商业自杀」，因为没有人相信AI真正能用。

　　全程1小时20分钟访谈中，李飞飞还谈了自己对AI未来影响人类的看法，以及当前技术能走多远，为何对「世界模型」如此着迷，以及「世界模型」究竟是什么....

　　在这场深度访谈中，李飞飞搭建了一座通往未来的阶梯，让我们得以一窥AI的下一个十年。

　　·人工智能没有任何是「人为」的，无论AI现在/将来做什么，都取决于人类自身。

　　在21世纪初，AI领域正处于漫长的「寒冬」。当时，AI更通常的叫法是「机器学习」。

　　这场「联姻」让科学家们意识到，仅仅依靠纯规则的程序，是无法让计算机具备强大的认知能力。

　　2000年，正在加州理工学院攻读博士学位的李飞飞，正式进入了AI这一领域，成为机器学习最早一代的研究者。

　　那时，她在加州理工上的第一门课，就叫「神经网络」。对此，她表示，「当时还真的是挺痛苦的」。

李飞飞站队LeCunAGI全是炒作！80分钟重磅爆料出炉(图2)

　　那会儿还正是所谓「AI寒冬」的中间阶段：公众几乎不关注这块儿，资金投入少，不过学界里倒是有各种各样的想法在流动。

　　因为，人类本质上是高度依赖视觉的动物。我们很大一部的智能，其实是建立在视觉、感知、空间理解之上的，而不只是语言本身。

　　另外一件事就是她发现了一大痛点：早年AI研究过于聚焦模型本身，但这些模型根本没有足够的数据来训练。

　　李飞飞突然意识到，人类学习和生物进化，本质上都是一个「大数据学习」的过程。

　　于是，她和学生提出了一个大胆的猜想——要让AI真正「活」起来，一个被严重忽视、却极其关键的要素，就是「大数据」。

　　于是，2006-2007年，李飞飞和学生们开始了一项在当时看来近乎疯狂的「蛮力」工程——ImageNet。

李飞飞站队LeCunAGI全是炒作！80分钟重磅爆料出炉(图3)

　　他们从互联网上搜集了1500万张图像，打上横跨22000个类别的精准标签。

　　这一年，来自多伦多大学一组研究者，在Geoffrey Hinton带领下参加了ImageNe 九游娱乐九游娱乐官方t挑战赛。

　　令世界震惊的是，他们仅用2块英伟达GPU+ImageNet数据，训练出首个在大规模视觉任务上表现出色的神经网络——AlexNet。

李飞飞站队LeCunAGI全是炒作！80分钟重磅爆料出炉(图4)

　　「大数据+神经网络+GPU」这三样技术，构成了现代AI的「黄金三件套」。

　　大概在2015年中到2016年中，硅谷大厂刻意避谈「AI」一词，他们并不确定，AI会不会是一个负面色彩的词。

　　李飞飞认为，在AI和AGI之间并没有清晰的科学界限，AGI更像是一个营销用语，而非严谨的科学术语。

　　当初，李飞飞之所以进入这一领域，便是被一个问题打动：机器能不能像人一样去思考、去做事？

　　对于她来说，这才是AI的「北极星」目标。不论别人怎么称呼，她自己对「AI」这个名字已经很满意。

李飞飞站队LeCunAGI全是炒作！80分钟重磅爆料出炉(图5)

　　在创办World Labs之前，李飞飞不止一次，公开宣称空间智能、世界模型的理念。

李飞飞站队LeCunAGI全是炒作！80分钟重磅爆料出炉(图6)

　　但在斯坦福，李飞飞和Percy Liang、Chris Batting等顶尖NLP研究者认为——这项技术会改变一切。

　　他们甚至成立了全球首个专门研究「基础模型」的研究中心，并发表了学术界第一篇系统性探讨基础性的论文。

　　因「视觉智能」出身，李飞飞当时就在想，除了语言，AI领域的发展还有很大的空间。

　　因为人类做成很多事，靠的并不只是语言，而是大量依赖的是自己的空间智能和对世界运作方式的理解。

　　她举了一个生动的「救火」例子，从侧面印证了，LLM再强也灭不了火、救不了人，设计不了大楼。

　　后来她突然意识到：要把语言之外的那些智能、要把「具身AI」机器人、要把视觉智能全都串在一起，中间那个关键的「枢纽」（linchpin）便是「空间智能」。

　　从2022年起，李飞飞开始基于在机器人和计算机视觉领域的研究，开始将这一概念系统化。

李飞飞站队LeCunAGI全是炒作！80分钟重磅爆料出炉(图7)

　　随后，她又创办了World Labs，world一词就写在了公司名字里，因为她相信「世界模型」和「空间智能」的重要性。

　　用李飞飞的话来说，当你输入一张图或一句话，就能生成一个无限探索的3D世界。

　　它是一个「基础层」，人们可以在这个基础之上进行推理、进行交互，也可以用它来创造各种世界。

　　除了机器人，她还认为，「人类本身也是具身的智能体」，能力可以被AI大幅增强。

　　人类作为具身智能体，其实同样可以从世界模型和空间智能模型中获益匪浅，而不仅仅是机器人。

　　在行业应用中，Marble深入了各个领域，其中包括电影与虚拟制片、游戏与互动内容、机器人模拟与训练等等。

李飞飞站队LeCunAGI全是炒作！80分钟重磅爆料出炉(图8)

　　电影拍摄中，大量场景是虚拟的，需要先在电脑里搭一个3D世界。然而，传统的美术团队手工建模、摆灯光、调摄像机位，耗时又耗钱。

　　李飞飞提到，艺术家团队以及导演们称，「这让他们的制作时间缩短了40倍」。

　　在游戏与互动内容领域，开发者可以把Marble生成的世界导出到游戏引擎里，用作关卡原型、场景底稿，再在上面加逻辑、玩法、角色。

　　当然，最重要的还是机器人模拟与训练。机器人要在现实世界工作，训练数据是个超级难题。

　　这也是我为什么要做ImageNet，因为我一直相信「大数据」在里面起着非常关键的作用。

　　而机器人则不同，它要输出的是「动作」，在真实三维世界中运动、抓取、接触。

　　而人类大部分训练数据，只有视频，没有真实动作轨迹。由此，研究者需要九游娱乐九游娱乐官方通过远程遥操作、合成、模拟环境……等来收集数据。

　　另一方面，机器人是一个「物理系统」。它更像自动驾驶汽车，而不是大语言模型。

　　这意味着，要让机器人真正工作起来，不仅需要「脑子」（算法和模型），还需要「身体」（硬件本体），还需要合适的应用场景。

　　回顾自动驾驶汽车发展的历史，从2005年DARPA挑战赛到今天的Waymo，近20年过去了，还未完全搞定「不撞任何东西」的目标。

　　它本质上就是一个在2D路面上跑的金属盒子，它的目标「不要碰到任何东西」。

　　所以，这条路肯定会很长，也会有很多不同的维度、不同的挑战，需要一起被一点一点解决。

　　她的态度不是「惨痛教训不成立」，而是机器人领域研究尚处早期阶段，数据问题、硬件问题、应用场景问题太多。

　　在数据方面，研究者通过Marble用提示词生成各种房间、工厂、厨房、仓库场景，让机器人先在虚拟世界练习。

　　除了创业，李飞飞依然在推动另一个「慢而重要」的工程：斯坦福HAI（以人为本人工智能研究院）。

　　我是音乐家，AI会不会取代我？我是中学老师，AI会不会让我的工作没价值？

　　而李飞飞回答非常坚定，是的，你在AI的未来里扮演着自己的角色。而且这个角色极其重要。

九游娱乐-九游中国最全游戏官方平台

李飞飞站队LeCunAGI全是炒作！80分钟重磅爆料出炉