來源:消費者報道
本文來源:消費者報道 作者:馮戀閣
4月16日,騰訊正式發(fā)布并開源混元3D世界模型2.0(HY-World2.0)。
HY-World2.0是一個多模態(tài)世界模型,能夠理解文字、圖片、視頻等不同類型輸入,自動生成、重建和模擬3D世界。據悉,這個世界模型同時支持多格式3D資產(Mesh/3DGS/點云等)導出。
(資料圖)
實測混元3D世界模型2.0
《消費者報道》實測發(fā)現,目前該網站界面上,有世界生成、世界重建、360°全景圖、實時生成世界四個不同類型的按鈕,可以體驗不同的3D場景生成功能。每一個按鈕對應不同互動類型的場景,而這些場景都可以借助圖片或視頻生成。
(圖源:官網截圖)
世界生成功能主要是文本或單視角圖像合成可沉浸式探索的三維世界。目前,只有獲得內測權限的用戶可以自主生成場景。
(圖源:官網截圖)
世界生成的可互動性是最高的,在生成自己的3D場景之后,用戶還可以選擇角色在3D場景中探索。行走、跳躍、轉換視角等都不會影響3D場景的空間結構與一致性。
(圖源:官網截圖)
世界重建功能則試圖從多視角輸入還原三維特征。
《消費者報道》嘗試環(huán)繞一個4平方米左右的空間錄了一段21秒的視頻,最后還原的3D模型,對空間大小、空間內部各個家具對應的位置關系展示得比較準確。
(圖源:官網截圖)
在同一個空間內,《消費者報道》嘗試通過照片來重建空間,這一次《消費者報道》拍攝了10張照片,但(如圖所示)重建結果相比視頻不夠準確,出現了家具重疊等問題。
(圖源:官網截圖)
《消費者報道》猜測,這可能是因為普通用戶沒有專業(yè)建模經驗,并不知道如何拍攝能夠囊括較多的空間位置信息,簡單說就是普通用戶如果要對空間重新建模,最好采用視頻方式而不是簡單的照片方式,如果是以照片方式,最好是提供多張多角度、且空間關系相對清楚的照片。
《消費者報道》注意到,混元世界模型提供的樣例里,提交32張相對位置關系比較清晰的圖片后,能夠生成較為精確的建筑外觀3D模型。
(圖源:官網截圖)
另外,360°全景圖則是輸入文本或單張圖片后,生成一個可以環(huán)繞觀看的全景畫面。
(圖源:官網截圖)
實時生成世界功能同樣也是輸入文本或單張圖片后,生成一個3D場景,用戶可以以第一人稱視角探索整個世界。
(圖源:官網截圖)
這意味著,用混元世界模型2.0生成的內容已經可以和游戲工作流無縫對接,生成游戲地圖和關卡原型。
世界模型的世界賽道
一個值得注意的事情是,這個世界模型是騰訊首席AI科學家姚順雨官宣加入該公司之后升級的第一個世界模型。
去年12月,騰訊成立AI Infra部、AI Data部、數據計算平臺部,全面強化其大模型的研發(fā)體系與核心能力。2025年12月17日姚順雨入職騰訊 ,出任“CEO/總裁辦公室”首席AI科學家,向騰訊總裁劉熾平匯報;同時兼任AI Infra部、大語言模型部負責人,向技術工程事業(yè)群總裁盧山匯報。
同天混元世界模型1.5發(fā)布。
自姚順雨加入以來,騰訊多條 AI 產品線迎來更新,最受關注的是 “龍蝦矩陣” 系列智能體。
騰訊的龍蝦矩陣今年3月開始顯山露水,目前已經有包括自研全場景桌面智能體WorkBuddy、直連微信的本地AI助手QClaw、騰訊云Lighthouse云端方案、企業(yè)級智能體開發(fā)平臺ADP等在內的多個獨立龍蝦產品。
4月初,騰訊旗下QQ瀏覽器AI發(fā)布瀏覽器“龍蝦”——QBotClaw后,QClaw V2 版本上線,更新了多Agent機制,利用不同Agent解決復雜問題。
而最新發(fā)布的混元3D世界模型2.0,其實是在騰訊去年發(fā)布的混元世界模型1.5基礎上升級,4個月后,升級后混元世界模型的主要亮點在于可以實時生成多格式的3D資產。
騰訊的技術報告提到,這些技術可賦能多元應用場景,涵蓋機器人仿真、環(huán)境建模等領域。
(圖源:報告截圖)
關于世界模型,目前還沒有一個放之四海而皆準的定義,不過在業(yè)界觀點看來,世界模型是一類能夠對現實世界環(huán)境進行仿真,預測未來狀態(tài)的生成式人工智能模型。世界模型需要具備能夠表示世界、預測未來、在世界里規(guī)劃和行動三種特征。
簡言之,如果大語言模型的原理是預測下一個詞匯,那世界模型預測并決策的則是下一秒環(huán)境的狀態(tài)和相應的動作。
其實目前科技巨頭們也在不斷投入對世界模型的建設,世界模型背后,有一個正在形成和擴大的AI細分市場。
谷歌在去年8月公布了通用世界模型Genie 3。2026年1月,谷歌向外部開放了Genie 3的實驗性研究原型——Project Genie。用戶輸入文字描述,能實時生成可交互、可探索的3D世界。
李飛飛的世界模型公司World Labs也在今年2月完成10億美元融資。此前據媒體報道,Meta的超級智能AI實驗室也與機器人團隊合作試圖構建世界模型。
中信證券研究認為,從內容生成時長、內在一致性、客觀物理規(guī)律遵從、體驗可重復性等方面,Project Genie仍處在較為早期階段,對于游戲引擎、游戲開發(fā)商的商業(yè)模式、競爭格局尚無法形成實質性影響,對于游戲廣告行業(yè)可能帶來潛在利好。
創(chuàng)2007年以來最低值!人民幣怎么了,還能漲回來嗎?
文 邱牧子進入9月份,人民幣對美元匯率走勢又起波瀾。以在岸人民幣為例
老公醉酒出上聯:“抱貂蟬,遇貴妃,問昭君,想西施”,老婆下聯牛
?圖片源于網絡如有侵權請及時聯系文末點擊在看感謝支持??
魔獸世界德魯伊變熊任務攻略 魔獸世界德魯伊變熊任務
1、放棄是可以再接的,你看你放棄的是哪一步,就去找哪一步給任務的那
張九齡詩《西江夜行》楷書全文,切切故鄉(xiāng)情。
西江夜行張九齡〔唐〕遙夜人何在,澄潭月里行。悠悠天宇曠,切切故
打破開發(fā)商壟斷的“集資建房”模式,為何如此難以落地?
打破開發(fā)商壟斷的“集資建房”模式,為何如此難以落地?,住宅,開發(fā)商,

關于我們 加入我們 聯系我們 商務合作 京ICP備2023000331號
創(chuàng)氪網 www.nxzjqyj.com 版權所有 技術支持:北京中業(yè)網網絡科技有限公司
投稿投訴聯系郵箱:317 493 128 @qq.com