央廣網(wǎng)北京4月27日消息(記者 陳越)4月27日,螞蟻靈光App正式上線“體驗世界模型 ”功能,成為業(yè)界首個可在移動端體驗世界模型的AGI產(chǎn)品。用戶只需上傳一張圖片,即可在手機上最長60秒探索3D世界,并且用手游操控視角,像玩游戲一樣在里面走動探索,從觸發(fā)指令到開始探索,僅需秒級。這是業(yè)內(nèi)首次實現(xiàn)在端側(cè)跑起世界模型,分鐘級的長時一致性、實時可交互的體驗再一次引領(lǐng)了AGI產(chǎn)品。靈光一直致力于探索智能的邊界,在此之前靈光上線“閃應(yīng)用”功能,率先實現(xiàn)在手機端30秒生應(yīng)用引領(lǐng)全民Wish Coding。

(圖說:手機上打開靈光APP,點擊左下角「?」號上傳圖片,點擊「生成圖中世界」,即可體驗世界模型)

世界模型被視為通向AGI(通用人工智能)的重要路徑之一,是連接數(shù)字世界與物理世界的重要橋梁。此次靈光App“體驗世界模型 ”功能背后接入了螞蟻靈波LingBot-World-Fast世界模型,該模型也已經(jīng)開源。

靈光App為用戶提供了便捷的世界模型體驗入口。打開靈光App,在對話框上傳一張圖片后,系統(tǒng)會智能推薦操作指令,用戶選擇“生成圖中世界”。或者,直接輸入“幫我用第一人稱視角探索這個世界”這類自然語言,系統(tǒng)會自動進入世界模型生成流程。從觸發(fā)指令到開始探索,僅需秒級。

進入世界模型體驗頁面后,靈光App針對移動端用戶的操作習慣進行了精心設(shè)計,創(chuàng)新性地引入了手游搖桿操控方式,讓用戶以最熟悉的方式探索AI即時生成的3D世界。具體而言,屏幕左側(cè)搖桿負責控制角色在3D場景中的位移,用戶可前后左右自由行走;右側(cè)搖桿則負責控制視角旋轉(zhuǎn),實現(xiàn)全方位環(huán)顧探索。這一操控邏輯與主流3D手游高度一致,玩家無需額外學習,即可上手操控,真正做到“零門檻沉浸”。

世界模型的移動端部署,是行業(yè)里公認的難題。算力需求大、延遲控制難、終端性能參差不齊,每一條都是實際的工程挑戰(zhàn)。靈光團隊采用高效、低延遲的流式傳輸技術(shù),實現(xiàn)了百毫秒級的響應(yīng)延遲,用戶從觸發(fā)指令到開始探索3D世界僅需秒級,打破了此前世界模型“高門檻、高算力、難落地”的刻板印象。

靈光App負責人蔡偉表示,“體驗世界模型功能是靈光在探索智能邊界的又一實踐。此前靈光推出的"閃應(yīng)用"功能可實現(xiàn)自然語言30秒生應(yīng)用,也是把原本專業(yè)開發(fā)者的Coding能力給到普通用戶。靈光希望不斷探索智能的邊界,挖掘用戶未被滿足的需求,把好的AI體驗給到所有人。”

目前,用戶可在各大應(yīng)用商店下載靈光App,直接體驗世界模型功能。

編輯:劉家怡
更多精彩資訊請在應(yīng)用市場下載“央廣網(wǎng)”客戶端。歡迎提供新聞線索,24小時報料熱線400-800-0088;消費者也可通過央廣網(wǎng)“啄木鳥消費者投訴平臺”線上投訴。版權(quán)聲明:本文章版權(quán)歸屬央廣網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載。轉(zhuǎn)載請聯(lián)系:cnrbanquan@cnr.cn,不尊重原創(chuàng)的行為我們將追究責任。
長按二維碼
關(guān)注精彩內(nèi)容