九游娱乐-九游中国最全游戏官方平台

李飞飞站队LeCunAGI全是炒作!80分钟重磅爆料出炉-九游娱乐

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

李飞飞站队LeCunAGI全是炒作!80分钟重磅爆料出炉

日期:2025-11-17 浏览: 

  重磅访谈放出,从AI革命兴起到下一个智能前沿——具备空间智能的世界模型。一场访谈,可以窥见AI教母关于AI未来的深刻洞察。

  二十年前,李飞飞主导创建的ImageNet,像一束火种,彻底点燃了深度学习的革命。

  如今,AI热潮席卷全球,她坚信「世界模型」才是未来十年AI的下一个前沿。

  就在今天,李飞飞在Lenny Rachitsky的新一期播客中,回顾了AI从寒冬如何走到了今天这一步。

李飞飞站队LeCunAGI全是炒作!80分钟重磅爆料出炉(图1)

  大概在九到十年前,自称AI公司的无异于「商业自杀」,因为没有人相信AI真正能用。

  全程1小时20分钟访谈中,李飞飞还谈了自己对AI未来影响人类的看法,以及当前技术能走多远,为何对「世界模型」如此着迷,以及「世界模型」究竟是什么....

  在这场深度访谈中,李飞飞搭建了一座通往未来的阶梯,让我们得以一窥AI的下一个十年。

  ·人工智能没有任何是「人为」的,无论AI现在/将来做什么,都取决于人类自身。

  在21世纪初,AI领域正处于漫长的「寒冬」。当时,AI更通常的叫法是「机器学习」。

  这场「联姻」让科学家们意识到,仅仅依靠纯规则的程序,是无法让计算机具备强大的认知能力。

  2000年,正在加州理工学院攻读博士学位的李飞飞,正式进入了AI这一领域,成为机器学习最早一代的研究者。

  那时,她在加州理工上的第一门课,就叫「神经网络」。对此,她表示,「当时还真的是挺痛苦的」。

李飞飞站队LeCunAGI全是炒作!80分钟重磅爆料出炉(图2)

  那会儿还正是所谓「AI寒冬」的中间阶段:公众几乎不关注这块儿,资金投入少,不过学界里倒是有各种各样的想法在流动。

  因为,人类本质上是高度依赖视觉的动物。我们很大一部的智能,其实是建立在视觉、感知、空间理解之上的,而不只是语言本身。

  另外一件事就是她发现了一大痛点:早年AI研究过于聚焦模型本身,但这些模型根本没有足够的数据来训练。

  李飞飞突然意识到,人类学习和生物进化,本质上都是一个「大数据学习」的过程。

  于是,她和学生提出了一个大胆的猜想——要让AI真正「活」起来,一个被严重忽视、却极其关键的要素,就是「大数据」。

  于是,2006-2007年,李飞飞和学生们开始了一项在当时看来近乎疯狂的「蛮力」工程——ImageNet。

李飞飞站队LeCunAGI全是炒作!80分钟重磅爆料出炉(图3)

  他们从互联网上搜集了1500万张图像,打上横跨22000个类别的精准标签。

  这一年,来自多伦多大学一组研究者,在Geoffrey Hinton带领下参加了ImageNe九游娱乐 九游娱乐官方t挑战赛。

  令世界震惊的是,他们仅用2块英伟达GPU+ImageNet数据,训练出首个在大规模视觉任务上表现出色的神经网络——AlexNet。

李飞飞站队LeCunAGI全是炒作!80分钟重磅爆料出炉(图4)

  「大数据+神经网络+GPU」这三样技术,构成了现代AI的「黄金三件套」。

  大概在2015年中到2016年中,硅谷大厂刻意避谈「AI」一词,他们并不确定,AI会不会是一个负面色彩的词。

  李飞飞认为,在AI和AGI之间并没有清晰的科学界限,AGI更像是一个营销用语,而非严谨的科学术语。

  当初,李飞飞之所以进入这一领域,便是被一个问题打动:机器能不能像人一样去思考、去做事?

  对于她来说,这才是AI的「北极星」目标。不论别人怎么称呼,她自己对「AI」这个名字已经很满意。

李飞飞站队LeCunAGI全是炒作!80分钟重磅爆料出炉(图5)

  在创办World Labs之前,李飞飞不止一次,公开宣称空间智能、世界模型的理念。

李飞飞站队LeCunAGI全是炒作!80分钟重磅爆料出炉(图6)

  但在斯坦福,李飞飞和Percy Liang、Chris Batting等顶尖NLP研究者认为——这项技术会改变一切。

  他们甚至成立了全球首个专门研究「基础模型」的研究中心,并发表了学术界第一篇系统性探讨基础性的论文。

  因「视觉智能」出身,李飞飞当时就在想,除了语言,AI领域的发展还有很大的空间。

  因为人类做成很多事,靠的并不只是语言,而是大量依赖的是自己的空间智能和对世界运作方式的理解。

  她举了一个生动的「救火」例子,从侧面印证了,LLM再强也灭不了火、救不了人,设计不了大楼。

  后来她突然意识到:要把语言之外的那些智能、要把「具身AI」机器人、要把视觉智能全都串在一起,中间那个关键的「枢纽」(linchpin)便是「空间智能」。

  从2022年起,李飞飞开始基于在机器人和计算机视觉领域的研究,开始将这一概念系统化。

李飞飞站队LeCunAGI全是炒作!80分钟重磅爆料出炉(图7)

  随后,她又创办了World Labs,world一词就写在了公司名字里,因为她相信「世界模型」和「空间智能」的重要性。

  用李飞飞的话来说,当你输入一张图或一句话,就能生成一个无限探索的3D世界。

  它是一个「基础层」,人们可以在这个基础之上进行推理、进行交互,也可以用它来创造各种世界。

  除了机器人,她还认为,「人类本身也是具身的智能体」,能力可以被AI大幅增强。

  人类作为具身智能体,其实同样可以从世界模型和空间智能模型中获益匪浅,而不仅仅是机器人。

  在行业应用中,Marble深入了各个领域,其中包括电影与虚拟制片、游戏与互动内容、机器人模拟与训练等等。

李飞飞站队LeCunAGI全是炒作!80分钟重磅爆料出炉(图8)

  电影拍摄中,大量场景是虚拟的,需要先在电脑里搭一个3D世界。然而,传统的美术团队手工建模、摆灯光、调摄像机位,耗时又耗钱。

  李飞飞提到,艺术家团队以及导演们称,「这让他们的制作时间缩短了40倍」。

  在游戏与互动内容领域,开发者可以把Marble生成的世界导出到游戏引擎里,用作关卡原型、场景底稿,再在上面加逻辑、玩法、角色。

  当然,最重要的还是机器人模拟与训练。机器人要在现实世界工作,训练数据是个超级难题。

  这也是我为什么要做ImageNet,因为我一直相信「大数据」在里面起着非常关键的作用。

  而机器人则不同,它要输出的是「动作」,在真实三维世界中运动、抓取、接触。

  而人类大部分训练数据,只有视频,没有真实动作轨迹。由此,研究者需要九游娱乐 九游娱乐官方通过远程遥操作、合成、模拟环境……等来收集数据。

  另一方面,机器人是一个「物理系统」。它更像自动驾驶汽车,而不是大语言模型。

  这意味着,要让机器人真正工作起来,不仅需要「脑子」(算法和模型),还需要「身体」(硬件本体),还需要合适的应用场景。

  回顾自动驾驶汽车发展的历史,从2005年DARPA挑战赛到今天的Waymo,近20年过去了,还未完全搞定「不撞任何东西」的目标。

  它本质上就是一个在2D路面上跑的金属盒子,它的目标「不要碰到任何东西」。

  所以,这条路肯定会很长,也会有很多不同的维度、不同的挑战,需要一起被一点一点解决。

  她的态度不是「惨痛教训不成立」,而是机器人领域研究尚处早期阶段,数据问题、硬件问题、应用场景问题太多。

  在数据方面,研究者通过Marble用提示词生成各种房间、工厂、厨房、仓库场景,让机器人先在虚拟世界练习。

  除了创业,李飞飞依然在推动另一个「慢而重要」的工程:斯坦福HAI(以人为本人工智能研究院)。

  我是音乐家,AI会不会取代我?我是中学老师,AI会不会让我的工作没价值?

  而李飞飞回答非常坚定,是的,你在AI的未来里扮演着自己的角色。而且这个角色极其重要。