新江南網(wǎng)歡迎你/loginbisaqq.com/新江南網(wǎng)榮譽出品 |
記者 金靜馨 攝
杭港大廈四樓,幾十雙眼睛正緊盯著屏幕——畫面中,機器人在千變萬化的客廳里流暢穿行,精準繞開散落的玩具與錯落的椅腳。
“用多大力氣可以打開一個柜子?”“撿起一個玩具,從哪個角度可以放進筐里?”群核科技的空間智能平臺SpatialVerse資深技術專家趙慶說,這些我們日?雌饋砥狡綗o奇的操作,對機器人而言,卻是一件難事。每一個動作背后,都涉及復雜的感知、判斷與執(zhí)行過程。
6月19日下午,浙江省科協(xié)“走進”系列科普活動,走進了被譽為“杭州六小龍”之一的群核科技,帶著公眾掀開人工智能最神秘的訓練幕布。
為機器人打造“數(shù)字道場”
訓練效果可以實現(xiàn)“爆炸性”增長
從53秒減少至1.2秒——這是“酷家樂”處理一張典型2K圖像GPU渲染的最新速度。
作為全球最大的空間設計平臺,群核科技旗下的“酷家樂”是一場效率革命的發(fā)起者。以前,家居設計行業(yè)的出圖環(huán)節(jié)一直是效率瓶頸!翱峒覙贰币劳袕姶蟮腉PU集群和自主研發(fā)的云端實時渲染引擎,將原本動輒數(shù)小時的渲染任務壓縮至幾秒鐘完成,“過去設計師需要數(shù)天完成的渲染圖,如今一杯咖啡未涼,方案已躍然眼前”。
3.62億個3D模型及空間設計元素,是“酷家樂”積累下來的數(shù)據(jù)。這些多場景的室內空間數(shù)據(jù),不僅構建起一個龐大的數(shù)字世界,更為群核科技從“空間設計平臺”邁向“空間智能賽道”提供了堅實支撐。在這里,每一幀渲染不僅是畫面的生成,更是未來空間的智慧預演。
“目前的人形機器人在運動控制和小腦技術方面已經取得了長足進展,”趙慶娓娓道來,“但真正讓它們‘聰明’起來的是數(shù)據(jù)!薄皺C器人要像人一樣思考、決策,就需要海量可交互的三維數(shù)據(jù)作為‘訓練場’,這就像人類的學習過程,沒有足夠的練習和反饋,就無法真正理解世界!壁w慶告訴大家,目前可交互的三維數(shù)據(jù)是突破人形機器人發(fā)展的瓶頸之一。
早在2018年,群核科技就和帝國理工學院、南加州大學展開了一項極具前瞻性的科研合作——發(fā)布當時全球最大的室內場景認知深度學習數(shù)據(jù)集InteriorNet。他們“腦洞大開”,把原本展示給業(yè)主的三維虛擬環(huán)境提供給機器人“學習”,讓機器人在虛擬空間里觀察、理解,然后做出決策。通過這種方式,探索怎么讓機器人更好地適應現(xiàn)實世界里那些復雜的環(huán)境。
看過《黑客帝國》的朋友,肯定對墨菲斯給尼奧搭建的“數(shù)字道場”印象深刻。在那個虛擬空間里,尼奧不管經歷什么,都只是數(shù)據(jù)在變化,等他訓練完,回到現(xiàn)實世界就能大顯身手。
現(xiàn)在,群核科技干的事兒就和這差不多,他們也在為具身智能、AIGC(人工智能生成內容)等打造“數(shù)字道場”,幫助AI走進真實的物理世界,推動空間智能的發(fā)展!拔覀冇萌汉丝萍计脚_積累的海量可交互三維數(shù)據(jù)和先進的渲染技術,給機器人搭建了很多高逼真、強交互的仿真環(huán)境。”趙慶一邊說著,一邊指向屏幕,“在這些虛擬環(huán)境里,機器人可以模擬現(xiàn)實世界里的復雜場景,一遍又一遍地訓練。”
就拿最常見的掃地機器人來說,不同家庭的環(huán)境差別可太大了。家具怎么擺、房間干不干凈、光線亮不亮,這些都會影響掃地機器人的清掃任務。有了群核空間智能平臺(SpatialVerse)打造的海量仿真訓練環(huán)境,掃地機器人可以在虛擬空間里進行億萬次訓練,模擬各種不同的家庭環(huán)境和清掃任務。而且,在數(shù)字世界中,時間是被壓縮的,“天上一天,人間一年”,在真實世界走一段10公里的路程可能需要半天,但在數(shù)字世界只需要幾秒。這讓實驗和訓練的速度大幅提升,訓練效果就像坐了火箭一樣飛速提升。
從造夢到落地
空間智能讓機器人更“智能”
“AI設計師會完全取代人類設計師嗎?”“未來機器人可以幫我寫作業(yè)嗎?”隨著趙慶的分享接近尾聲,現(xiàn)場的大小朋友們紛紛舉手,迫不及待地拋出他們的問題。
趙慶笑著回答:“其實我們人類最早發(fā)明機器人,就是因為‘懶’。我們想讓機器人幫我們工作,所以有了工業(yè)機器人;現(xiàn)在,我們想讓機器人幫我們做家務,所以越來越多的家庭服務機器人正在出現(xiàn)。當然未來機器人一定會有幫我們完成作業(yè)的能力。但學習這件事,是屬于自己的成長旅程,是不能、也不該由機器人來代替的。”
在談到未來機器人的應用和發(fā)展,一位觀眾說:“我還指望機器人幫我養(yǎng)老呢!壁w慶向大家透露:“我們現(xiàn)在合作的一些企業(yè),已經在部署機器人到醫(yī)院、養(yǎng)老院等,用于日常護理、陪伴、環(huán)境監(jiān)測等任務。相信在不久的將來,機器人會成為我們生活中溫暖而可靠的‘銀發(fā)助手’。”
分享結束后,大家又興致勃勃地參觀了群核科技的展廳。一進入展廳,一塊巨大的數(shù)據(jù)大屏便映入眼簾,屏幕上不斷跳動的數(shù)字仿佛是整個平臺的“心跳”:今日發(fā)起渲染任務1809397次,這個數(shù)字還在不斷增長,而全球用戶任務也如潮水般涌動……
趙慶告訴大家,這背后正是群核科技兩大核心技術引擎——啟真(渲染)引擎和矩陣(CAD)引擎的協(xié)同發(fā)力!叭绻f我們是在為AI打造一個理解世界的‘眼睛’,那么啟真引擎就是這個‘眼睛’的核心!北热缭诋斚禄馃岬目缇畴娚填I域,基于此引擎的酷家樂棚拍解決方案,就深受出海賣家青睞。而如果說啟真引擎負責“造夢”,那矩陣引擎則負責“落地”。作為群核自研的CAD建模引擎,矩陣引擎能夠對空間進行高精度、結構化的描述,是AI真正理解物理世界的基礎能力之一。通過矩陣引擎,AI不僅能識別一張桌子的形狀,還能理解它是用來吃飯的、還是工作用的;不僅能知道一間屋子的長寬高,還能判斷哪里適合放沙發(fā)、哪里該留通道。這種結構化的能力,正是讓AI從“看得見”走向“看得懂”的關鍵一步。
新江南網(wǎng)歡迎你/loginbisaqq.com/新江南網(wǎng)榮譽出品 |
聲明:
本文僅代表作者個人觀點,與新江南網(wǎng)無關。其原創(chuàng)性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容,新江南網(wǎng)號系信息發(fā)布平臺,新江南網(wǎng)僅提供信息存儲空間服務。如有侵權請出示權屬憑證聯(lián)系管理員(yin040310@sina.com)刪除!
閱讀推薦
新聞爆料