发布询价单
您的位置:首页 > 资讯 > 企业动态 > 正文

李飞飞:目前人工智能还在玩文字和图片的“二维游戏”,其无穷的未来在“空间智能”!

2025-11-14 10:07 性质:转载 作者:PYMNTS  来源:pymnts
免责声明:无人机网(www.youuav.com)尊重合法版权,反对侵权盗版。(凡是我网所转载之文章,文中所有文字内容和图片视频之知识产权均系原作者和机构所有。文章内容观点,与本网无关。如有需要删除,敬请来电商榷!)
被誉为“人工智能教母”的李飞飞认为,当前以大型语言模型和图像分类器为主导的人工智能时代已经达到了极限。在她新发表的文章《从文字到世界》中,她写道,虽然机器已经掌握了文字和图像,但它们...

被誉为“人工智能教母”的李飞飞认为,当前以大型语言模型和图像分类器为主导的人工智能时代已经达到了极限

在她新发表的文章《从文字到世界》中,她写道,虽然机器已经掌握了文字和图像,但它们仍然缺乏理解空间、运动和后果所需的基本认知。“我们制造出了能够读写的机器,”她写道,“但却没有制造出能够看、能够动、能够生活在这个世界上的机器。”

为什么人工智能需要空间智能

李的核心观点是,如果没有空间智能——即感知几何形状、深度、运动以及物体间关系的能力——人工智能就无法取得更大的进步。大型语言模型能够生成和组织信息,但完全基于抽象概念运行,无法感知事物在真实空间中的变化。计算机视觉系统可以识别物体,但无法推断这些物体如何交互、运动或演变。PYMNTS 最近的一篇报道指出,教会机器像人类一样观察,将使下一代自主系统与静态模式识别器区分开来。

空间智能使机器不仅能够理解场景中存在什么,还能理解物体移动或环境变化时场景将如何变化。缺乏这种能力,机器人和智能系统只能执行狭窄的任务,难以适应不可预测的环境。李等人认为,赋予机器建模和预测现实世界动态的能力,将使它们能够在瞬息万变的环境中更安全、更高效地运行。

当前人工智能的不足之处

如今的人工智能可以进行分析和分类,但缺乏推理行为及其后果的能力。语言模型可能知道门是什么,但无法判断门是开着的还是关着的,也无法预测门关上后会发生什么。视觉系统可以检测运动或物体,但无法推断意图或预测接下来会发生什么。

PYMNTS 的一篇文章清晰地描述了这个问题:人工智能可以标记、分类和描述世界,但却无法在世界中生存。基于静态图像或文本训练的系统,一旦现实与训练数据存在差异,就会面临挑战。

广告:滚动继续

这种差距限制了人工智能在受控环境之外的应用。工厂机器人仍然依赖预先编程的布局,自动驾驶车辆难以应对罕见或意外事件,许多人工智能系统仍然只是观察者,而非其所服务环境中的积极参与者。李指出,在人工智能获得空间感知能力之前,它的作用将仅限于狭义的预测,而非广泛的自主行为。

构建世界模型

为了克服这些局限性,研究人员正在开发所谓的“世界模型”,这些系统旨在理解世界的运行方式,而不仅仅是它的外观。这些模型整合了感知、模拟、空间推理和预测,使机器能够构建内部因果模型。它们不再仅仅从文本和静态图像中学习,而是从环境、模拟和传感器输入中学习,从而理解物体如何运动、交互以及随时间变化。

谷歌DeepMind的Genie 3能够生成受物理定律支配的3D环境,人工智能体通过探索虚拟世界而非静态数据集进行学习。英伟达的Cosmos平台也遵循类似的路径,在模拟真实世界物理规律的环境中训练机器人。这些发展反映了整个行业正在经历一场更广泛的转变,即从模式识别转向基于现实的理解。

世界经济论坛最近将这种转变描述为人工智能的下一个主要前沿领域。在其2025年关于空间计算、可穿戴设备和机器人的报告中,该组织表示,空间技术正开始融合数字世界和物理世界,创造“一个能够理解上下文、运动和交互的持久智能层”。

论坛指出,传感器、计算机视觉和实时地图的融合将为未来十年人机协作奠定基础,届时人工智能不仅能够处理数据,还能解读瞬息万变的世界。论坛强调,空间计算的进步将如何催生更直观的界面、更智能的工业机器人以及能够动态响应人机空间移动的自适应城市系统。

这些见解与李的观点不谋而合,即人工智能的真正进步取决于将智能与物理世界联系起来。空间计算赋予人工智能感知输入和情境感知能力,使其能够安全有效地与周围环境互动,从而将静态模型转变为其所服务环境中的积极参与者。

事情将如何变化

李认为,空间智能将重新定义人工智能的功能和行为方式。借助世界模型,机器将从被动分析转向主动规划和适应。例如,仓库机器人可以绕过不断变化的库存规划路径,而不是在被阻挡时停止;自动驾驶汽车可以预测行人的移动,而不是等待明确的信号;甚至有一天,数字助理也能解读手势、空间环境或共享的视觉框架。

其产业意义重大。PYMNTS 近期一篇关于空间计算和数字孪生的文章指出,企业正在将人工智能与现实世界的地图和传感器数据相结合,以便在现实世界中执行决策之前进行虚拟测试。真实环境的数字副本正成为空间感知人工智能的训练场,从而能够在低风险环境下进行高风险模拟。

关注官方微信

手机扫码看新闻