“當(dāng)我們用高斯表達(dá)替代像素,人類終于能‘走進’曾經(jīng)記錄的空間。這不是科幻,而是群核科技正在推動的技術(shù)革命?!苯?,群核科技首席科學(xué)家唐睿在接受證券時報記者專訪時表示。
近日,“杭州六小龍”之一群核科技發(fā)布最新高質(zhì)量3D高斯語義數(shù)據(jù)集InteriorGS,旨在為機器人和AI智能體提升空間感知能力,并攜這一產(chǎn)品及相應(yīng)智能體解決方案亮相近日舉辦的2025世界人工智能大會。
據(jù)悉,InteriorGS數(shù)據(jù)集包含1000個3D高斯語義場景,涵蓋超80種室內(nèi)環(huán)境,賦予智能體一個“空間大腦”,以提高其環(huán)境理解和交互能力,其核心突破在于用高斯函數(shù)替代像素作為信息載體。
唐睿向記者表示,3D高斯語義數(shù)據(jù)集最大的特點,就是用高斯函數(shù)的方法去代替像素的表達(dá),其優(yōu)勢在于能將時空記錄轉(zhuǎn)化為可進入的虛擬空間,支持在記錄的空間中漫游、行走,實現(xiàn)身臨其境的還原。因此,它可以可支持機器人在虛擬3D世界中與場景交互、觀測,結(jié)合提供的語義信息,加速下游智能機器的智能化開發(fā),提升效率并降低成本。
這種技術(shù)變革帶來的直接改變是沉浸式還原,對于具身智能的發(fā)展而言,3D高斯語義數(shù)據(jù)集的價值更為關(guān)鍵?!斑@相當(dāng)于給機器人建了一所‘虛擬學(xué)?!?,”唐睿指出,1000個場景構(gòu)成的語義豐富的虛擬空間,能讓機器人通過與虛擬環(huán)境的持續(xù)交互,學(xué)習(xí)空間理解、物體識別、動作決策等能力。在語義信息的加持下,機器人能更快理解“桌子”“椅子”等物品的功能屬性,而不僅是識別外形,這將大幅降低下游智能化開發(fā)的成本。
談及空間智能與具身智能的技術(shù)差異,唐睿認(rèn)為兩者是“同源異流”。在他看來,空間智能的核心是做數(shù)字世界與物理世界的橋梁,解決空間的創(chuàng)作、理解與表達(dá)問題;而具身智能在此基礎(chǔ)上,還需要攻克物理世界的硬件難題。
“具身智能的難點更復(fù)雜,它是軟件算法與硬件工程的結(jié)合體,不僅要‘看懂’空間,還要‘動手’改造空間,例如,機器人疊被子不僅需要理解‘被子’的空間形態(tài),還涉及機械臂的扭矩控制、傳感器精度等硬件技術(shù)?!碧祁_M一步解釋道。
然而,在采集與使用虛擬數(shù)據(jù)的過程中始終存在真實性鴻溝,對此,群核科技給出“雙管齊下”的解決路徑,“一方面通過算力中心和算法迭代,提升物理世界的仿真精度,讓虛擬場景更接近真實世界的物理規(guī)律;另一方面,聯(lián)合學(xué)界和下游企業(yè)探索‘虛實融合’的訓(xùn)練策略。”唐睿告訴記者。
唐睿表示,在具身智能領(lǐng)域中,群核科技定位于機器人的“虛擬教材編寫者”。 通過空間智能技術(shù)構(gòu)建高保真虛擬場景,讓機器人在“數(shù)字操場”里低成本、高效率地訓(xùn)練,再由下游團隊將訓(xùn)練成果落地到物理設(shè)備。這種分工模式,正推動具身智能從實驗室走向產(chǎn)業(yè)化。