九九读小说网

手机浏览器扫描二维码访问

一文搞懂世界模型:ai如何“脑补”真实世界?(第1页)

最近,AI领域里“世界模型”这个词越来越火,各大科技巨头纷纷入局,像是谷歌发布Genie 3,昆仑万维推出Matrix-Game 2.0,腾讯开源HunyuanWorld-Voyager。这世界模型到底是啥?为啥科技大厂们都对它趋之若鹜?它和我们熟悉的ChatGPT又有啥区别?别着急,接下来就用最通俗易懂的大白话,结合大家熟知的例子,带你彻底搞懂世界模型。

一、先搞懂:世界模型是啥?和普通AI模型有啥不一样?

(一)世界模型:让AI“看懂”真实世界

简单来说,世界模型是一种能让AI理解和模拟真实世界的模型。以往的AI模型,像图像识别模型只能分辨图片里有什么,语言模型只能处理文字信息。但世界模型不一样,它能把视觉、语言、动作等多种信息融合在一起,形成对世界的整体认知,还能预测未来可能发生的事。

举个例子,你看到一个小孩在玩皮球,皮球滚到桌子下面。我们人类不用看也知道,皮球还在桌子下面,不会凭空消失。这是因为我们大脑里有一个“世界模型”,能理解物体的运动规律和空间关系。而普通AI如果只看到皮球滚到桌子下这一帧画面,它很难理解皮球去了哪,因为它没有对世界的整体认知。但有了世界模型的AI,就能像人一样“脑补”出皮球在桌子下的画面,还能预测如果小孩去桌子下找皮球,会发生什么。

(二)和ChatGPT这类语言模型的区别

我们熟悉的ChatGPT属于大语言模型,主要处理文本信息。它能根据你输入的文字,生成相关的回答,比如你问它“明天天气怎么样”,它能根据数据和算法给出答案。但ChatGPT没有对真实世界的感知和理解,它不知道天气变化会对现实生活有什么影响,也无法和真实世界进行交互。

而世界模型更像是一个“智能模拟器”,它不仅能理解语言,还能理解图像、声音等信息,能在虚拟环境里模拟真实世界的物理规律和变化。比如你给世界模型输入一张房间的图片,再告诉它“把椅子搬到窗户边”,它能模拟出椅子移动后的房间画面,还能考虑到椅子移动时会不会撞到其他东西,这是ChatGPT这类语言模型做不到的。

(三)世界模型的起源:从心理学猜想开始

世界模型的概念最早源于心理学对“人脑如何表征外部现实”的猜想。1943年,苏格兰心理学家Kenneth Craik提出“脑内小尺度模型”假设,认为生物体若能在大脑里携带外部现实的简化副本,就可先“脑内试错”,再输出行动。这就好比我们在做一件事之前,会先在脑海里想一下可能的结果,再决定怎么做。

后来,经过认知科学、机器人学与强化学习的交叉演化,世界模型逐渐发展起来。2018年,“World Models”论文的发表,标志着世界模型概念正式被深度学习社区采纳。从那以后,世界模型在AI领域不断发展,成为实现通用人工智能(AGI)的重要路径之一。

二、世界模型能干啥?这些应用场景和我们息息相关

(一)游戏领域:打造“无限可能”的开放世界

在游戏里,世界模型能让游戏场景更加真实、动态,玩家的每一个动作都能实时影响游戏世界。比如,你在玩一款开放世界游戏,当你走进一片森林,以往的游戏可能是提前设定好森林里的场景和物品。但有了世界模型,森林里的树木会根据你的靠近产生光影变化,小动物会因为你的脚步声而逃窜,甚至天气也会随着时间和你的行动实时变化。

昆仑万维的Matrix-Game 2.0在这方面就表现出色。它是一款交互式世界模型,参数量仅有1.8B,能跑在单块GPU上。你只需上传一张静态图片,它就能基于该图像加载并生成一个虚拟世界。玩家可以通过方向键或WASD键控制人物在虚拟世界中的移动,且每一次人物的移动都会实时影响环境,并生成新的视频内容。像丢给它一张3A大作《荒野大镖客》的游戏画面,它能模拟出非常细腻的自然景观,河流蜿蜒流淌,还能模拟出流水的动态效果,大大增加了游戏的真实感与沉浸感。

(二)自动驾驶:提前“预判”复杂路况

自动驾驶汽车需要应对各种复杂路况,世界模型能帮助它提前“预判”可能出现的危险,做出更安全的决策。比如,当自动驾驶汽车遇到前方突然变道的车辆时,世界模型可以根据车辆的速度、距离以及周围环境信息,预测出可能的碰撞风险,并及时调整车速和行驶方向。

热门小说推荐
一剑吞鸿

一剑吞鸿

风萧水寒天朝月,汉家风骨义当先。暮雪朝霜英雄气,历净天华成江山。这天下!江湖有侠气,庙堂存仁义。百姓知冷暖,君臣死社稷。从来没有一个人的江湖,且看一穷二白的人儿们,圈一盛机巧、提两腔虎胆、......携三分执念,演绎出一甲子江山风流。这是两座没有主角儿的江湖,本故事纯属虚构,部分人物以史为骨、推敲升华,如有雷同,纯属巧合,祝阅读愉快。【展开】【收起】...

这主角我当不了

这主角我当不了

晏双是穿书局的老员工,即将要完成他的最后一本书,之后他就可以一次性提取他在各本书里积攒的退休金,过快乐的养老生活。 进入书后,好消息——他是主角,坏消息——他是狗血虐文里的主角,摆在他面前的是一受多攻毫不重叠的整整五条剧毒感情线。 渣攻1号:主仆契约虐身虐心 渣攻2号:挖肾救白月光 渣攻3号:洗脑改造羞耻play 渣攻4号:你很好但可惜不是处男 渣攻5号:救他,我可以娶你 晏双:他急着退休,赶紧滴吧 #笑死,根本不虐# 【非np,后面不剧透了,大家不要乱猜了】...

星能玩家

星能玩家

简介:80万年前,人类学会控制火的使用;公元100年左右,风力、水力等自然动力利用于生产;18世纪,以蒸汽机的发明和煤炭的大规模使用为标志,人类进入煤炭能源时代。19世纪末期,电力的开发及利用。20世纪,石油和天然气资源的开发,人类社会进入煤炭、石油、天然气的油气能源时代。23世纪,人类发现星能。...公元2327......

天荒神羽

天荒神羽

天地初始四方神天,一方执掌万界诸天。纪元之初,上古登天者并起,落幕之际,神天十三帝没落。至古时代,黑暗入侵。天地繁华,大道争锋。天地初开,帝主陨落。神荒羽帝,寻道轮回。洛天羽身为混沌传人,入神天,落禁地,一步踏道,一念成空。渺小洪荒,没落古界,却成就一方混沌帝主。黑暗界域,乱古世间,古老盟约却几人遵守?古天神庭,神......

花若盛开

花若盛开

穿越成乡野秀才家的十二岁孙女,祖母早亡,父母杳无音信,祖父新丧,为了逃避无良族人的胡搅蛮缠,带着七岁的幼弟和祖父十二年前的一个酒后戏言婚约,离乡背井,远赴人生地不熟的上京城。努力开铺子,买农庄,种地,开辟出一片新天地,过程有笑有泪,结局温馨。一开始,男主是拒绝女主的,觉得女主是一个乡野的丫头,估计又黑又丑,目不识丁......

闲云见故山

闲云见故山

闲云见故山情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的网游动漫小说,闲云见故山-清不虚道短-小说旗免费提供闲云见故山最新清爽干净的文字章节在线阅读和TXT下载。...