阿联酋, 技术2025. 11. 15

阿布扎比AI新突破：PAN预测未来

运用人工智能预测未来：阿布扎比MBZUAI的新突破

近年来，人工智能的发展势头迅猛，特别是在视频生成和世界建模领域。尽管像OpenAI的Sora或谷歌Veo这样的系统提供了令人印象深刻的视觉体验，但它们往往难以维持场景的逻辑连贯性或物体的空间一致性。这就是阿布扎比最新的创新——预测行动网络（PAN）发挥作用的地方，它可能开启AI应用的新纪元。

PAN能做到其他系统不能做到的事情是什么？

由位于阿布扎比的穆罕默德·本·扎耶德人工智能大学（MBZUAI）开发的预测行动网络（PAN）不仅仅是一个视频生成系统；它是一个能记录事件并基于此进行未来状态预测的世界建模AI。这意味着PAN“理解”场景中发生的事情，并能在场景中保持空间和逻辑连贯性的情况下推断下一步。

传统的人工智能系统常常迷失于细节：例如，它们可以生成一个物体移动的场景，但后来无法准确地将该物体定位在环境中。相比之下，PAN可以遵循长指令链，比如“将盒子放在桌子上，然后后退两步”，在持续管理物体的放置、移动和关系时表现出色。

PAN是如何工作的？

该系统以两个阶段运行。首先，它创建环境的内部表示，识别对象、动作和它们之间的关系。这一步类似于观察景象并将其在脑海中绘制出来。然后，它将这一内部模型转化为可根据指令逐步更新的视觉显示。

这种结构化的双步骤方法允许PAN在较长场景序列中仍能保持稳定性和现实感，这对于模拟、机器人或自动化系统测试至关重要。

为什么这一发展在实践中很重要？

世界建模AI如PAN在先前模拟物理环境成本过高或过于危险的领域开启了新可能性。考虑到工厂模拟设计，在极端天气条件下测试自动驾驶汽车，或在人工环境中训练机器人，PAN允许对这些情况进行安全且具成本效益的预建模。

该系统可能成为工业设计、机器人、城市规划、自动驾驶车辆以及许多其他领域的重要工具，因为它不仅呈现场景，还预测其逻辑结果。

开放获取与技术独立

PAN的独特性不仅体现在其技术能力上，还体现在其完全开放获取上。任何人都可以在panworld.ai上获取模型及其详细文档。此举不仅有助于全球AI研究社区，也标志着阿联酋走向技术独立的战略举措。

该项目不仅在阿布扎比开发，还与巴黎和硅谷的团队合作，表明阿联酋在构建自身知识体系的同时积极与全球研究网络连接。

不仅是视频：解读与推断

据MBZUAI称，PAN是迈向不仅生成图像且能思考的AI的第一步。该系统不仅仅是“显示”世界，而是解读它：观察事件如何相互影响并预测其后果。这一能力让我们更接近真正智能的AI——一种不仅视觉上令人印象深刻，而且能够得出理性、一致的人性化推断的AI。

结论

PAN的引入不仅是技术上的里程碑，也是人工智能世界思维方式转变的开端。虽然大多数系统努力最大化视觉质量，但阿布扎比的研究人员创建了一个在逻辑、解读和长期一致性方面脱颖而出的模型。PAN明确指出，人工智能的未来不仅是“展示”，而且是理解。而这是一种比我们以前见过的更强大、更有用的能力。

（本文基于穆罕默德·本·扎耶德人工智能大学（MBZUAI）的一次演讲。）

最后更新：2025. 11. 15 17:55

如果您在此页面发现错误，请通过电子邮件告知我们。

加载中...