人形機器人邁向“具身智能”的核心瓶頸——高質(zhì)量訓(xùn)練數(shù)據(jù),迎來了規(guī)模化供給。近日,國內(nèi)最大的人形機器人訓(xùn)練場——人形機器人數(shù)據(jù)訓(xùn)練中心在京啟用,憑借萬平空間與年產(chǎn)超600萬條數(shù)據(jù)的能力,為行業(yè)注入寶貴“數(shù)據(jù)燃料”,旨在破解模型從仿真到真機的“現(xiàn)實落差”難題。

圖:人形機器人數(shù)據(jù)訓(xùn)練中心
超萬平方米多元場景,搭建未來產(chǎn)業(yè)“練兵場”
步入訓(xùn)練場,仿佛提前看到了“未來世界”。上萬平方米的空間內(nèi),1:1還原了工業(yè)智造、智慧家庭、康養(yǎng)服務(wù)和5G融合四大類共16個細分場景。
從中興的智能生產(chǎn)線到一汽集團的汽車車間,從順豐快遞的稱重打包到聯(lián)合利華公司的洗發(fā)水裝箱,以及海晨物流的紙箱打包等場景,每一個細節(jié)都真實還原實際作業(yè)環(huán)境。這里也是國內(nèi)覆蓋場景最全、仿真程度最高的訓(xùn)練場之一。
訓(xùn)練場內(nèi),還能看到身高1.66米、全身40+自由度的“夸父”(Kuavo)人形機器人正在各個場景中刻苦“練習(xí)”。通過VR設(shè)備、動作捕捉系統(tǒng)等先進裝備,機器人學(xué)習(xí)著空箱回庫、物料分揀、稱重打包、產(chǎn)品裝箱等實用技能,執(zhí)行成功率95%以上。目前,這些機器人已掌握20多項原子技能,能夠勝任搬運、巡檢、導(dǎo)覽、配送等多種任務(wù)。

圖:臺面清潔

圖:垃圾分類回收
政府企業(yè)協(xié)同,共筑具身智能“數(shù)據(jù)引擎”
作為落實國務(wù)院《關(guān)于深入實施“人工智能+”行動的意見》中“加強高質(zhì)量數(shù)據(jù)集建設(shè)”要求的具體實踐,該訓(xùn)練場由石景山區(qū)政府牽頭,聯(lián)合區(qū)屬產(chǎn)業(yè)公司、北京銀保產(chǎn)業(yè)園及人形機器人領(lǐng)軍企業(yè)樂聚機器人共同運營。項目通過整合政府、產(chǎn)業(yè)、高校、科研與金融多方資源,構(gòu)建協(xié)同機制,為打造自主可控的具身智能基礎(chǔ)設(shè)施提供系統(tǒng)支撐。
“就像教孩子學(xué)走路需要大量練習(xí)一樣,機器人也需要在多種場景中反復(fù)訓(xùn)練才能變得更聰明。”項目負責(zé)人介紹,“訓(xùn)練場就是要解決機器人行業(yè)目前面臨的數(shù)據(jù)短缺問題。”

圖:快消品裝箱

圖:SMT料盤架下料
全流程數(shù)據(jù)閉環(huán),實現(xiàn)具身智能數(shù)據(jù)“高質(zhì)快產(chǎn)”
據(jù)了解,該訓(xùn)練場年均可產(chǎn)出超600萬條高質(zhì)量數(shù)據(jù),規(guī)模居全國人形機器人訓(xùn)練場首位。通過全國跨區(qū)分布式數(shù)采生產(chǎn),平臺已與蘇州、濟南、合肥、鄭州等多地訓(xùn)練場聯(lián)動,形成全國數(shù)據(jù)中樞,預(yù)計月數(shù)據(jù)產(chǎn)能可達5000小時。
負責(zé)人表示,該訓(xùn)練場所有數(shù)據(jù)均來源于真機運行,具備跨本體、跨場景的遷移能力,有效應(yīng)對了行業(yè)中存在的數(shù)據(jù)質(zhì)量差、成本高、遷移難等痛點。依托自研數(shù)采平臺,通過采集、清洗、標(biāo)注、導(dǎo)出四步流程,結(jié)合“自動+人工+模型”三重質(zhì)檢機制,實現(xiàn)高質(zhì)量數(shù)據(jù)交付,經(jīng)專業(yè)機構(gòu)認證,單條數(shù)據(jù)合格率達99%。
“以往各企業(yè)分散采集訓(xùn)練,就像‘小作坊生產(chǎn)’,數(shù)據(jù)質(zhì)量參差不齊。”技術(shù)人員介紹,“現(xiàn)在通過標(biāo)準(zhǔn)化、規(guī)模化的數(shù)據(jù)生產(chǎn),我們能夠為整個行業(yè)提供高質(zhì)量、低成本的數(shù)據(jù)服務(wù)。”未來,依托海量真實數(shù)據(jù),團隊還將進一步推進數(shù)據(jù)標(biāo)準(zhǔn)制定和模型訓(xùn)練工作,通過交互式訓(xùn)練等方式,構(gòu)建從單機控制到群體協(xié)作的完整訓(xùn)練體系。

圖:小件工裝上料
突破數(shù)據(jù)瓶頸,賦能具身智能產(chǎn)業(yè)標(biāo)準(zhǔn)化發(fā)展
數(shù)據(jù)是人形機器人實現(xiàn)智能化的核心要素。當(dāng)前,具身智能行業(yè)面臨數(shù)據(jù)質(zhì)量參差不齊、多模態(tài)數(shù)據(jù)采集門檻高、數(shù)據(jù)規(guī)模與場景泛化能力不足等痛點。盡管視覺語言動作模型(VLA)為機器人實現(xiàn)跨平臺、跨場景泛化能力提供了技術(shù)路徑,但其性能很大程度上依賴高質(zhì)量、大規(guī)模訓(xùn)練數(shù)據(jù)的支撐。同時,仿真數(shù)據(jù)、合成數(shù)據(jù)等無法完全復(fù)現(xiàn)真實物理交互、傳感器噪聲、環(huán)境動態(tài)擾動、執(zhí)行器延遲等細節(jié),而真機數(shù)據(jù)是模型從“紙上談兵”走向“現(xiàn)實落地”的關(guān)鍵橋梁。
據(jù)負責(zé)人介紹,該訓(xùn)練場已建立全流程標(biāo)準(zhǔn)化數(shù)據(jù)體系,正積極推動異構(gòu)數(shù)據(jù)融合與開放合作,所提供的數(shù)據(jù)集可直接用于訓(xùn)練通用型機器人基模型(Base Model),為行業(yè)構(gòu)建跨本體、跨任務(wù)的數(shù)據(jù)公共基礎(chǔ),助力我國人形機器人產(chǎn)業(yè)實現(xiàn)標(biāo)準(zhǔn)化、規(guī)模化發(fā)展。
“訓(xùn)練+應(yīng)用+孵化+科普”四位一體,打造全國具身數(shù)據(jù)服務(wù)平臺
訓(xùn)練場創(chuàng)新構(gòu)建“訓(xùn)練+應(yīng)用+孵化+科普”四位一體發(fā)展模式,致力打造全國具身智能公共數(shù)據(jù)服務(wù)底座平臺。不僅推進具身語料服務(wù)與數(shù)據(jù)交易,同時聯(lián)合北京通用人工智能研究院等機構(gòu)加強“具身大腦”研發(fā)與應(yīng)用;通過產(chǎn)業(yè)基金支持創(chuàng)新孵化、舉辦“第一屆具身智能操作任務(wù)挑戰(zhàn)賽”等高水平賽事,并面向社會開展科普教育與人才培養(yǎng),積極構(gòu)建開放協(xié)同的產(chǎn)業(yè)生態(tài)。

圖:“訓(xùn)練+應(yīng)用+孵化+科普”
該訓(xùn)練場的投用,為我國人形機器人產(chǎn)業(yè)按下了快進鍵。它不僅是機器人的“技能培訓(xùn)學(xué)校”,更是推動其從實驗室走向規(guī)模化應(yīng)用的基石。隨著機器人在這里完成“實訓(xùn)”并走向市場,一個智能機器人與人類協(xié)同工作的新時代正加速到來。












