近日,蘋果機器學習團隊聯(lián)合南京大學與香港科技大學,發(fā)布了一項具有突破性的 AI 成果 ——Matrix3D 3D AI 模型,該模型專注于從少量 2D 照片中重建真實世界的物體和場景,極大地簡化了 3D 重建流程。
傳統(tǒng)攝影測量技術在構建 3D 模型或地圖時,依賴姿態(tài)估計、深度預測等多個獨立模型分步處理,過程繁瑣且易出錯。Matrix3D 則另辟蹊徑,通過統(tǒng)一架構,一次性整合圖像、相機參數(shù)(如角度、焦距)以及深度數(shù)據(jù)等元素,減少中間環(huán)節(jié),使重建過程更加流暢、可靠,有效降低了人為錯誤風險,提升整體性能。
在訓練策略上,Matrix3D 采用掩碼學習方法,類似于早期 Transformer 基礎 AI 系統(tǒng)以及 ChatGPT 早期版本的訓練理念。訓練時隨機隱藏部分輸入數(shù)據(jù),促使模型學會 “填充空白”,增強了模型適應性,即便面對較小或不完整的數(shù)據(jù)集,也能有效學習關鍵特征。 經過測試,Matrix3D 展現(xiàn)出強大性能。用戶僅需提供三張輸入圖像,模型便能生成包括物體和整體環(huán)境在內的詳細 3D 重建,為沉浸式技術的實際應用帶來了新的可能。無論是在影視制作、游戲開發(fā),還是建筑設計、文物數(shù)字化等領域,Matrix3D 都有望憑借其便捷高效的 3D 重建能力,發(fā)揮重要作用,進一步推動 AI 技術在多行業(yè)的深度應用與創(chuàng)新發(fā)展
來【龍頭AI網(wǎng)】了解最新AI資訊!
暫無評論
發(fā)表評論