7月4日,2024世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(以下簡(jiǎn)稱WAIC 2024)在上海世博中心開幕。
從2022年卷起一輪又一輪風(fēng)潮的大模型,以及今年新晉為產(chǎn)業(yè)界“明星”的人形機(jī)器人,成為本次大會(huì)的絕對(duì)焦點(diǎn)。100多個(gè)大模型、20多款人形機(jī)器人占據(jù)了世博展覽館大部分展區(qū),展現(xiàn)出澎湃的向“新”力。
機(jī)器人“姑娘”跳舞
4日下午1點(diǎn)半,世博展覽館熱度與氣溫同步攀升。記者隨人流剛一進(jìn)入展館,就與“十八金剛”結(jié)結(jié)實(shí)實(shí)打了個(gè)照面——18臺(tái)極具未來(lái)感的人形機(jī)器人整齊劃一地列隊(duì)“迎賓”,場(chǎng)面頗為震撼。
宇樹科技的四足機(jī)器人在玩后空翻、天鏈人形機(jī)器人T1練起“一字馬”、睿爾曼的超輕量機(jī)械臂給假模特“按摩”……展會(huì)現(xiàn)場(chǎng)成了機(jī)器人的“練兵場(chǎng)”。逐際動(dòng)力的工作人員為了展示雙足機(jī)器人P1的穩(wěn)定性,時(shí)不時(shí)給它來(lái)上一腳,圍觀觀眾驚呼地跟著它倒退,看到它快速調(diào)整站穩(wěn)后一起松了口氣。
當(dāng)天,達(dá)闥人形雙足機(jī)器人XR4首發(fā)首展。5位撲閃著大眼睛、頭戴蝴蝶結(jié)的機(jī)器人“姑娘”跳起了舞,擺頭、起手、旋轉(zhuǎn)都相當(dāng)絲滑。工作人員介紹,XR4身高168厘米,采用碳纖維復(fù)合材料打造,全身?yè)碛?0多個(gè)智能柔性關(guān)節(jié),能以每小時(shí)3.5公里的速度移動(dòng)。
首發(fā)新品還有特斯拉人形機(jī)器人擎天柱二代(Optimus-Gen 2)。它低調(diào)地待在透明保護(hù)罩里,被觀眾里三層外三層地圍觀拍照。據(jù)了解,擎天柱二代行走速度提升了30%,手指“進(jìn)化”到不僅有觸覺,還能“游刃有余”地輕握雞蛋和搬運(yùn)重物。近期,擎天柱二代開始嘗試“打工”——在特斯拉工廠進(jìn)行電池分揀訓(xùn)練。
從外觀來(lái)看,人形機(jī)器人的體型和面部特征與人類愈發(fā)接近,“大腦”也變得更加智能,這背后是強(qiáng)大的技術(shù)支撐。比如宇樹H1通用人形機(jī)器人,采用360°全景深度感知技術(shù),配備自主研發(fā)的關(guān)節(jié)電機(jī),是全球首款擁有原地后空翻能力的全尺寸電驅(qū)人形機(jī)器人。國(guó)內(nèi)首款全尺寸通用人形機(jī)器人公版機(jī)“青龍”,由人形機(jī)器人(上海)有限公司自主研發(fā),擁有高度仿生的軀干構(gòu)型和擬人化的運(yùn)動(dòng)控制,全身多達(dá)43個(gè)主動(dòng)自由度,支持多模態(tài)機(jī)動(dòng)、感知、交互和操控,代表了目前人形機(jī)器人行業(yè)比較頂尖的硬件設(shè)計(jì)水平。
一張照片生成人物視頻
2022年ChatGPT橫空出世,引發(fā)2023年國(guó)內(nèi)大模型“百模大戰(zhàn)”。WAIC 2024展會(huì)上,訊飛星火大模型V4.0、商湯日日新5.5等多個(gè)新一代大模型首發(fā)首秀。多個(gè)大模型發(fā)布最新進(jìn)展:螞蟻百靈大模型已具備原生多模態(tài)能力,騰訊宣布開源全球最大甲骨文多模態(tài)數(shù)據(jù)集,百度智能云宣布文心大模型4.0 Turbo面向企業(yè)客戶全面開放……越來(lái)越多的智能終端搭載了大模型,以提升其性能及效率。
工信部去年發(fā)文要求打造人形機(jī)器人的“大腦”和“小腦”,其中“大腦”即指人工智能大模型。此次參展的樂(lè)聚人形機(jī)器人“夸父”(KUAVO),搭載華為旗下的盤古具身智能大模型,機(jī)器人由此實(shí)現(xiàn)全方位視覺感知、跳躍、多地形行走等能力;達(dá)闥人形機(jī)器人XR4,搭載其自研的多模態(tài)大模型RobotGPT,具備多模態(tài)融合感知、認(rèn)知、決策和行為生成能力。
值得關(guān)注的是,大模型正在積極“上車”。極越汽車展臺(tái)打出“汽車機(jī)器人”的宣傳語(yǔ),工作人員介紹,極越07采用純視覺算法的智能駕駛系統(tǒng),搭載百度AI大模型,在擁堵和低速跟車時(shí),可對(duì)前方障礙物的速度與加速度進(jìn)行檢測(cè),以此優(yōu)化準(zhǔn)確率和跟車效率。
在商湯展臺(tái),參觀者紛紛體驗(yàn)Vimi——僅用一張照片就能生成人物視頻,這也是現(xiàn)場(chǎng)最為直觀的大模型落地場(chǎng)景。Vimi是商湯發(fā)布的首個(gè)面向C端的可控人物視頻生成大模型,能根據(jù)一張人物照片,穩(wěn)定生成長(zhǎng)達(dá)1分鐘的單鏡頭人物視頻,并支持動(dòng)畫、聲音、文字等多種元素的驅(qū)動(dòng)方式。
大模型應(yīng)用已經(jīng)逐步浮現(xiàn),業(yè)界看好其對(duì)于現(xiàn)有業(yè)態(tài)的改造作用。4日下午的產(chǎn)業(yè)發(fā)展主論壇上,百度董事長(zhǎng)李彥宏在分享時(shí)認(rèn)為,沒有應(yīng)用,光有基礎(chǔ)模型,不管是開源還是閉源都一文不值。
“空中飛的”從昆山起飛
在WAIC 2024展覽的核心技術(shù)、智能終端、應(yīng)用賦能板塊,都能看到蘇企的身影。
位于南京江北新區(qū)的智子引擎,攜國(guó)產(chǎn)自研的Awaker多模態(tài)大模型系列產(chǎn)品正式亮相,其中包括Awaker Chatimg對(duì)話模型、Awaker Search檢索模型、Awaker Gen生成模型!癆waker是業(yè)界首個(gè)實(shí)現(xiàn)真正自主更新的多模態(tài)大模型,適用于無(wú)人機(jī)智慧巡檢、全域防控等多個(gè)場(chǎng)景!痹摴臼袌(chǎng)部人員告訴記者,公司積極推進(jìn)Awaker與智能設(shè)備相融合,此次帶來(lái)3款基礎(chǔ)硬件產(chǎn)品:Awaker訓(xùn)推一體機(jī)、城市治理一體機(jī)、智子·搜幀一體機(jī),為多模態(tài)大模型落地各行各業(yè)提供解決方案,助力產(chǎn)業(yè)升級(jí)。
機(jī)器人領(lǐng)域,來(lái)自常州的睿爾曼帶來(lái)行業(yè)領(lǐng)先的超輕量仿人機(jī)械臂。“它能夠模擬人類手臂的復(fù)雜動(dòng)作,制作咖啡、推拿理療、高危工業(yè)場(chǎng)景中的精細(xì)化操作任務(wù),都可以勝任。”睿爾曼相關(guān)負(fù)責(zé)人牛勇在現(xiàn)場(chǎng)一一展示多款機(jī)械臂,配合不同應(yīng)用場(chǎng)景,機(jī)械臂的末端既可以安裝“手掌”,也可以安裝夾爪,還能與四足機(jī)器人結(jié)合,是人形機(jī)器人必不可少的關(guān)鍵部件。
作為WAIC 2024展覽八大“鎮(zhèn)館之寶”之一,3架陳列在展館中庭的eVTOL(電動(dòng)垂直起降航空器)十分搶鏡。這是峰飛航空科技帶來(lái)的盛世龍eVTOL模型機(jī),場(chǎng)外供人體驗(yàn)的真機(jī)就出自設(shè)在昆山的制造基地。該公司品牌部相關(guān)負(fù)責(zé)人介紹,eVTOL又被稱為“空中出租車”,“盛世龍”采用復(fù)合翼構(gòu)型,結(jié)合了直升機(jī)和固定翼飛機(jī)的特點(diǎn),無(wú)須傳統(tǒng)機(jī)場(chǎng)和跑道就可垂直起降,在空中則轉(zhuǎn)換成固定翼水平巡航,有望應(yīng)用于城市內(nèi)空中出行,以大幅節(jié)約出行時(shí)間。未來(lái),越來(lái)越多的“空中飛的”將從昆山起運(yùn)交付全球客戶。
聲明:
本文僅代表作者個(gè)人觀點(diǎn),與新江南網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容,新江南網(wǎng)號(hào)系信息發(fā)布平臺(tái),新江南網(wǎng)僅提供信息存儲(chǔ)空間服務(wù)。如有侵權(quán)請(qǐng)出示權(quán)屬憑證聯(lián)系管理員(yin040310@sina.com)刪除!
閱讀推薦
新聞爆料
圖片精選
點(diǎn)擊排行