http://007sbw.cn 2025-05-08 09:53 來源:庫帕思
2025年4月30日,經(jīng)上海市人工智能行業(yè)協(xié)會審查通過,庫帕思牽頭發(fā)布《具身智能語料庫建設(shè)導(dǎo)則》(T/SAIAS 018—2025)團(tuán)體標(biāo)準(zhǔn)修訂版。《導(dǎo)則》修訂版由上海人工智能行業(yè)協(xié)會歸口,由上海庫帕思科技有限公司牽頭,聯(lián)合上海人工智能創(chuàng)新中心、人形機(jī)器人(上海)有限公司、上海電器科學(xué)研究所(集團(tuán))有限公司、上海智元新創(chuàng)技術(shù)有限公司、上海穹徹智能科技有限公司、上海傅利葉科技有限公司、上海開普勒探索機(jī)器人有限公司、中國電子科技集團(tuán)公司第二十一研究所、星海圖(蘇州) 人工智能科技有限公司和中國信通院上海工創(chuàng)中心等22家研究機(jī)構(gòu)、行業(yè)協(xié)會和企業(yè)共同編制。
在人工智能的浪潮中,具身智能作為前沿科技的代表,正受到國家和上海市的高度重視。2024年11月由庫帕思牽頭發(fā)布的《具身智能語料庫建設(shè)導(dǎo)則》正是在這一背景下應(yīng)運(yùn)而生,提供了建設(shè)具身智能數(shù)據(jù)、具身智能數(shù)據(jù)采集方式、具身智能語料生產(chǎn)方法和數(shù)據(jù)安全方面的技術(shù)指導(dǎo)方法,為具身智能研究提供統(tǒng)一的語料庫建設(shè)框架。2025年2月,結(jié)合當(dāng)前具身智能行業(yè)的新發(fā)展,充分考慮具身智能領(lǐng)域數(shù)據(jù)采集的多樣性和數(shù)據(jù)質(zhì)量的有效性,特別是對模型訓(xùn)練的可驗(yàn)證性等,庫帕思主動牽頭啟動該標(biāo)準(zhǔn)的修訂工作,迅速組建修編工作小組,聯(lián)合機(jī)器人企業(yè)、科研機(jī)構(gòu)、高校等,深入開展行業(yè)調(diào)研,收集整理相關(guān)數(shù)據(jù)資料,起草標(biāo)準(zhǔn)修訂版,并根據(jù)各方反饋意見進(jìn)行修改完善。本次修訂聚焦五大核心領(lǐng)域:
數(shù)據(jù)存儲方案兼容性:補(bǔ)充具身智能數(shù)據(jù)常見底層存儲格式;
采集方式完整性:補(bǔ)充“生產(chǎn)伴隨”數(shù)據(jù)采集模式及數(shù)據(jù)生產(chǎn)標(biāo)準(zhǔn);
場景分類標(biāo)準(zhǔn)化:補(bǔ)充具身智能數(shù)據(jù)場景分類體系,包括場景、任務(wù)及原子技能等;
操作規(guī)范場景適配性:補(bǔ)充具身智能數(shù)據(jù)各個(gè)場景下的操作規(guī)范和采集標(biāo)準(zhǔn);
質(zhì)量驗(yàn)證模型導(dǎo)向性:補(bǔ)充多種數(shù)據(jù)采集方式下的數(shù)據(jù)質(zhì)量驗(yàn)證方法,加強(qiáng)數(shù)據(jù)預(yù)處理。
《具身智能語料庫建設(shè)導(dǎo)則》修訂版旨在為語料庫的建設(shè)提供更堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)和標(biāo)準(zhǔn)化指導(dǎo)。通過構(gòu)建覆蓋全流程的標(biāo)準(zhǔn)化體系,有效解決行業(yè)在數(shù)據(jù)采集多樣性、質(zhì)量驗(yàn)證可靠性、存儲方案兼容性等方面的共性問題。未來該標(biāo)準(zhǔn)的實(shí)施將推動具身智能技術(shù)的創(chuàng)新和應(yīng)用,為具身智能產(chǎn)業(yè)的科學(xué)健康發(fā)展注入強(qiáng)大動力。