http://007sbw.cn 2025-08-07 09:20 來源:中國電子報
今年政府工作報告提出,培育生物制造、量子科技、具身智能、6G等未來產(chǎn)業(yè)。其中,具身智能產(chǎn)業(yè)發(fā)展意義重大,它是人工智能與物理世界深度融合的必然范式,是人工智能從“會說”到“會做”的關(guān)鍵跨越,是搶占全球產(chǎn)業(yè)科技競爭制高點的核心戰(zhàn)略舉措。為此,著力強(qiáng)化四大核心技術(shù)體系建設(shè)、構(gòu)建覆蓋全產(chǎn)業(yè)鏈的標(biāo)準(zhǔn)體系以搶占國際話語權(quán)、推動形成多主體多維度協(xié)同發(fā)力的發(fā)展格局,已然成為我國推動具身智能產(chǎn)業(yè)高質(zhì)量發(fā)展、牢牢把握國際競爭主動權(quán)的重要保障。
四大核心技術(shù)體系構(gòu)筑具身智能技術(shù)底座
從技術(shù)層面,需要持續(xù)鍛造“智能大腦”“銳利感官”“強(qiáng)健體魄”仿真與“模擬到現(xiàn)實”遷移技術(shù)這四個具身智能產(chǎn)業(yè)技術(shù)底座。
以視覺-語言-行動大模型為核心的“智能大腦”是實現(xiàn)機(jī)器人通用性與泛化能力的根本。當(dāng)前,具身智能的技術(shù)范式正從為特定任務(wù)訓(xùn)練專用“小模型”的傳統(tǒng)路徑,轉(zhuǎn)向研發(fā)能夠適配多任務(wù)、多場景的“大模型”或機(jī)器人基礎(chǔ)模型。其中,視覺-語言-行動(Vision-Language-Action,VLA)模型代表了最前沿的技術(shù)方向,這種方法通過將機(jī)器人的動作指令(如關(guān)節(jié)角度、末端位姿)編碼為文本符號(Tokens),實現(xiàn)了機(jī)器人控制數(shù)據(jù)與語言數(shù)據(jù)的統(tǒng)一,使得模型能夠?qū)幕ヂ?lián)網(wǎng)學(xué)到的廣泛世界知識和語義理解能力遷移至機(jī)器人控制任務(wù)中。構(gòu)建國家級、多模態(tài)、跨平臺的機(jī)器人交互數(shù)據(jù)庫,并研發(fā)自主可控的機(jī)器人基礎(chǔ)模型,已成為保障我國產(chǎn)業(yè)安全與發(fā)展主導(dǎo)權(quán)的戰(zhàn)略要務(wù)。
自主感知與導(dǎo)航系統(tǒng)構(gòu)成了機(jī)器人的“銳利感官”,是其在復(fù)雜動態(tài)環(huán)境中自主作業(yè)的前提。機(jī)器人要在非結(jié)構(gòu)化環(huán)境中有效執(zhí)行任務(wù),首先必須精確回答“我在哪里”并理解“周圍是什么”的問題,這依賴于其感知與導(dǎo)航能力。即時定位與地圖構(gòu)建技術(shù)是此能力的核心,它允許機(jī)器人在未知環(huán)境中實時構(gòu)建地圖并進(jìn)行自我定位。為應(yīng)對高速運動和弱紋理等挑戰(zhàn)性場景,視覺慣性里程計通過融合攝像頭與慣性測量單元的數(shù)據(jù),提供了更為魯棒和精確的位姿估計,其技術(shù)路線正朝著更適用于嵌入式系統(tǒng)的高效濾波算法方向發(fā)展。語義SLAM的出現(xiàn)是該領(lǐng)域的重大突破,它通過深度學(xué)習(xí)模型識別并標(biāo)記環(huán)境中的物體類別(如桌子、椅子、門),將幾何地圖升級為機(jī)器人可理解的“世界模型”。這不僅能通過剔除動態(tài)物體來提升定位精度,更關(guān)鍵的是,它建立了底層感知與上層大模型決策之間的橋梁,使機(jī)器人能夠執(zhí)行“把桌上的杯子拿過來”這類包含語義的復(fù)雜指令??梢哉f,沒有語義SLAM,VLA大模型便是“睜眼瞎”,其強(qiáng)大的推理能力將因無法與物理世界對應(yīng)而失效。
高性能端側(cè)計算芯片、先進(jìn)傳感器與新型驅(qū)動器共同構(gòu)成了支撐智能涌現(xiàn)的“強(qiáng)健體魄”。具身智能的實現(xiàn),不僅依賴于先進(jìn)的算法模型,更需要強(qiáng)大硬件體系的支撐,三者協(xié)同進(jìn)化,缺一不可。首先,高性能端側(cè)AI芯片是機(jī)器人的“前線大腦”,負(fù)責(zé)在本地實時運行復(fù)雜的感知、決策與控制模型,以保證低延遲和高自主性。端側(cè)芯片/先進(jìn)傳感器、大面積柔性觸覺傳感器(電子皮膚)、以準(zhǔn)直驅(qū)執(zhí)行器為代表的新型驅(qū)動器,這三大硬件支柱的融合,正推動機(jī)器人控制范式從傳統(tǒng)的、剛性的“位置控制”向柔性的、適應(yīng)性的“力-交互控制”轉(zhuǎn)變,這是具身智能在物理層面的核心體現(xiàn)。
仿真與“模擬到現(xiàn)實”遷移技術(shù)是破解機(jī)器人模型訓(xùn)練瓶頸、加速產(chǎn)業(yè)化進(jìn)程的關(guān)鍵工程方法。訓(xùn)練具身智能模型,尤其是采用強(qiáng)化學(xué)習(xí)路徑的模型,需要在海量交互中進(jìn)行試錯學(xué)習(xí),這在物理世界中不僅成本高昂、耗時漫長,更存在嚴(yán)重的安全風(fēng)險。因此,在虛擬仿真環(huán)境中進(jìn)行大規(guī)模、并行化的訓(xùn)練,再將學(xué)成的策略遷移到真實機(jī)器人上,已成為業(yè)界重要的技術(shù)路徑。然而,仿真環(huán)境與物理世界之間固有的差異,即“模擬到現(xiàn)實”(Sim2Real)的鴻溝,是該路徑的核心挑戰(zhàn),直接導(dǎo)致在仿真中表現(xiàn)優(yōu)異的策略在現(xiàn)實中性能下降甚至完全失效。未來,具身智能產(chǎn)業(yè)的競爭優(yōu)勢,將不僅取決于模型算法的優(yōu)劣,更取決于誰能構(gòu)建最高效、最逼真的Sim2Real技術(shù)管線。管線整合了高保真物理引擎、自動化數(shù)據(jù)生成和高效遷移算法,構(gòu)成了生產(chǎn)機(jī)器人“智能”的虛擬工廠,是支撐整個產(chǎn)業(yè)發(fā)展的關(guān)鍵數(shù)字基礎(chǔ)設(shè)施。
全方位推進(jìn)具身智能產(chǎn)業(yè)標(biāo)準(zhǔn)體系建設(shè)
標(biāo)準(zhǔn)是產(chǎn)業(yè)發(fā)展的基礎(chǔ)設(shè)施和通用語言,具身智能產(chǎn)業(yè)作為一個新興且高度復(fù)雜的交叉領(lǐng)域,其健康發(fā)展迫切需要一套系統(tǒng)、完善的標(biāo)準(zhǔn)體系進(jìn)行引導(dǎo)和規(guī)范。構(gòu)建完善的具身智能產(chǎn)業(yè)標(biāo)準(zhǔn)體系有助于提升我國在該產(chǎn)業(yè)的核心競爭力與國際話語權(quán)。
建立覆蓋全產(chǎn)業(yè)鏈的標(biāo)準(zhǔn)體系是提升核心競爭力與國際話語權(quán)的根本保障。我國已發(fā)布《國家人工智能產(chǎn)業(yè)綜合標(biāo)準(zhǔn)化體系建設(shè)指南(2024版)》《國家智能制造標(biāo)準(zhǔn)體系建設(shè)指南(2024版)》等頂層設(shè)計文件,覆蓋從設(shè)計、生產(chǎn)到集成應(yīng)用的全生命周期,為具體智能產(chǎn)業(yè)標(biāo)準(zhǔn)體系建設(shè)提供了相關(guān)經(jīng)驗借鑒。標(biāo)準(zhǔn)不僅要規(guī)范具身智能本體的機(jī)械電氣性能,更要涵蓋其智能算法、數(shù)據(jù)接口、軟件平臺乃至倫理規(guī)范等全新維度。當(dāng)前產(chǎn)業(yè)尚處早期,技術(shù)路線仍在快速演進(jìn),主導(dǎo)制定關(guān)鍵標(biāo)準(zhǔn),能夠有效引導(dǎo)國內(nèi)技術(shù)路徑的統(tǒng)一,降低產(chǎn)業(yè)內(nèi)部協(xié)作成本,形成技術(shù)和生態(tài)合力。
主導(dǎo)制定性能評測、功能安全與數(shù)據(jù)規(guī)范等關(guān)鍵國家標(biāo)準(zhǔn),并深度參與國際標(biāo)準(zhǔn)協(xié)調(diào)。在具身智能的標(biāo)準(zhǔn)體系建設(shè)中,應(yīng)優(yōu)先聚焦于對產(chǎn)業(yè)發(fā)展具有決定性影響的核心領(lǐng)域。首先,在性能評測方面,需建立一套能夠科學(xué)評估具身智能體在非結(jié)構(gòu)化環(huán)境中自主感知、決策和執(zhí)行能力的綜合評測基準(zhǔn)與方法學(xué),為技術(shù)迭代和市場采購提供客觀依據(jù)。其次,在功能安全領(lǐng)域,在依托現(xiàn)有機(jī)器人安全標(biāo)準(zhǔn)的基礎(chǔ)上,前瞻性地應(yīng)對具身智能帶來的新挑戰(zhàn)。我國應(yīng)迅速跟進(jìn)國際標(biāo)準(zhǔn)化組織(ISO)發(fā)布的工業(yè)機(jī)器人安全技術(shù)要求系列國際標(biāo)準(zhǔn),主動對標(biāo)達(dá)標(biāo),制定符合國情的網(wǎng)絡(luò)-物理安全技術(shù)規(guī)范與認(rèn)證體系。最后,在數(shù)據(jù)與接口規(guī)范方面,應(yīng)著力推動機(jī)器人操作系統(tǒng)、感知數(shù)據(jù)、模型接口、模塊化組件等關(guān)鍵環(huán)節(jié)的標(biāo)準(zhǔn)化,以打破生態(tài)壁壘,促進(jìn)產(chǎn)業(yè)鏈上下游的協(xié)同創(chuàng)新。
國際標(biāo)準(zhǔn)體系已初步形成,我國需在國際標(biāo)準(zhǔn)組織中積極貢獻(xiàn)方案以掌握主動權(quán)。當(dāng)前,全球具身智能相關(guān)領(lǐng)域的標(biāo)準(zhǔn)化工作正由幾大核心國際組織分工推進(jìn),形成了一個既有分工又有交叉的復(fù)雜格局。國際標(biāo)準(zhǔn)化組織、國際電工委員會(IEC)、ISO/IEC JTC 1/SC 42人工智能分技術(shù)委員會、電氣與電子工程師協(xié)會(IEEE)在推進(jìn)具身智能、機(jī)器人標(biāo)準(zhǔn)化工作方面各有側(cè)重。我國需建立國家層面的統(tǒng)籌協(xié)調(diào)機(jī)制,整合產(chǎn)業(yè)界和學(xué)術(shù)界的力量,系統(tǒng)性地向這些國際組織輸送專家、提交提案,確保我國的技術(shù)路線和產(chǎn)業(yè)利益能在國際標(biāo)準(zhǔn)中得到充分體現(xiàn),避免在未來全球市場中陷入被動。
五大對策推動我國具身智能產(chǎn)業(yè)發(fā)展
推動我國具身智能產(chǎn)業(yè)高質(zhì)量發(fā)展是一個復(fù)雜的系統(tǒng)工程,需多主體多維度協(xié)同發(fā)力。
強(qiáng)化頂層戰(zhàn)略規(guī)劃與國家安全需求深度融合。一是建議成立國家級具身智能發(fā)展領(lǐng)導(dǎo)協(xié)調(diào)小組,統(tǒng)籌相關(guān)部門等,將經(jīng)濟(jì)安全、產(chǎn)業(yè)鏈韌性、技術(shù)自主等國家安全目標(biāo)融入規(guī)劃、資源配置與項目評估全過程,避免重復(fù)建設(shè)。二是在“十五五”人工智能產(chǎn)業(yè)規(guī)劃基礎(chǔ)上,制定國家具身智能發(fā)展路線圖與行動計劃,明確近、中、遠(yuǎn)期目標(biāo)、關(guān)鍵任務(wù)與責(zé)任主體,建立動態(tài)評估調(diào)整機(jī)制。三是鑒于具身智能技術(shù)與關(guān)鍵基礎(chǔ)設(shè)施、國防體系的深度綁定,須在研發(fā)初期即同步介入安全考量,建立“安全內(nèi)生”機(jī)制,從源頭防范化解風(fēng)險。
集中力量突破核心技術(shù)瓶頸,保障產(chǎn)業(yè)鏈供應(yīng)鏈安全可控。一是建議設(shè)立相關(guān)重大科技專項,發(fā)揮新型舉國體制優(yōu)勢,集中攻關(guān)AI芯片、高精度傳感器、精密減速器、伺服電機(jī)等核心硬件短板,加速本土化發(fā)展。持續(xù)投入多模態(tài)大模型、強(qiáng)化學(xué)習(xí)、高逼真度仿真平臺等基礎(chǔ)算法研究,保持國際前沿水平。二是綜合運用國家科技計劃、引導(dǎo)基金、稅收優(yōu)惠、首臺(套)示范應(yīng)用等政策工具,激勵企業(yè)研發(fā)投入與產(chǎn)業(yè)鏈上下游協(xié)調(diào),探索應(yīng)用硬件可信執(zhí)行環(huán)境等技術(shù)提升供應(yīng)鏈安全。三是打破軟硬件壁壘,促進(jìn)二者在研發(fā)、測試、應(yīng)用中深度融合與協(xié)同進(jìn)化,構(gòu)建自主可控的技術(shù)體系。
加快構(gòu)建數(shù)據(jù)共享生態(tài)、統(tǒng)一技術(shù)標(biāo)準(zhǔn)與公共測試平臺。一是建議由相關(guān)部門牽頭,聯(lián)合地方、龍頭企業(yè)與研究機(jī)構(gòu),建設(shè)國家級具身智能交互數(shù)據(jù)共享平臺,并制定數(shù)據(jù)安全、隱私保護(hù)與合規(guī)使用規(guī)范,以解決數(shù)據(jù)壁壘問題。二是加速推進(jìn)國家標(biāo)準(zhǔn)體系建設(shè),涵蓋硬件接口、軟件架構(gòu)、通信協(xié)議、功能安全、信息安全及倫理規(guī)范,積極主導(dǎo)或參與國際標(biāo)準(zhǔn)制定。三是加大投入建設(shè)高保真仿真平臺與物理試驗場,為技術(shù)系統(tǒng)提供安全可控的測試驗證環(huán)境,降低真實世界試驗風(fēng)險,加速技術(shù)成熟。
系統(tǒng)性拓展應(yīng)用場景,引導(dǎo)技術(shù)有序賦能經(jīng)濟(jì)社會發(fā)展。一是建議產(chǎn)業(yè)主管部門引導(dǎo)智庫機(jī)構(gòu),發(fā)布具身智能優(yōu)先應(yīng)用場景目錄,引導(dǎo)資源向制造業(yè)(柔性裝配、智能檢測)、物流(倉儲分揀、末端配送)、能源礦山(巡檢、高危作業(yè))、醫(yī)療康養(yǎng)(手術(shù)輔助、養(yǎng)老陪護(hù))及公共安全(應(yīng)急救援、安防巡邏)等高價值領(lǐng)域傾斜。二是大力實施“人工智能+”行動,通過政府示范采購、財政補(bǔ)貼、稅收優(yōu)惠及設(shè)立“監(jiān)管沙盒”等方式,降低早期應(yīng)用風(fēng)險,鼓勵行業(yè)應(yīng)用。三是強(qiáng)化供需對接,支持研發(fā)企業(yè)與終端用戶共同開發(fā)解決方案,避免技術(shù)與需求脫節(jié),確保研發(fā)成果能夠解決行業(yè)痛點。發(fā)展初期應(yīng)采取有重點、分階段的推進(jìn)策略,優(yōu)先在技術(shù)相對成熟、需求迫切的標(biāo)桿場景取得突破,以點帶面,為后續(xù)推廣奠定基礎(chǔ)。
優(yōu)化人才培養(yǎng)體系,構(gòu)建協(xié)同創(chuàng)新生態(tài)。一是建議完善從職業(yè)教育到頂尖科研的多層次人才培養(yǎng)體系,加強(qiáng)多學(xué)科交叉融合,并大力推行產(chǎn)教融合,使人才培養(yǎng)緊貼產(chǎn)業(yè)需求。二是制定更具吸引力的人才引進(jìn)政策,在全球范圍延攬頂尖科學(xué)家與工程師。三是著力構(gòu)建開放協(xié)同的創(chuàng)新生態(tài),鼓勵龍頭企業(yè)、高校、科研院所加強(qiáng)合作,支持開源社區(qū)與開放平臺建設(shè),并運用金融工具支持初創(chuàng)企業(yè)。四是積極參與聯(lián)合國、國際電信聯(lián)盟、國際標(biāo)準(zhǔn)化組織等框架下的全球治理對話,主動提出中國方案,推動形成公平合理的國際AI治理體系。