918.com·官方网站机械(江苏)有限公司
售前:0510-87061341
售后:0510-87076718
技术:0510-87076708
邮箱:bk@163.com
微信公众号二维码
微信公众号


近5000平米的“数据工场”里人类手把手教机械人

  没无数据的,就像没有油的车。正在这个庞大的锻炼场里,最忙碌的可能不是,而是背后的一个个配备了采集设备或是身穿动捕服等专业配备的人类操做员和质检团队。人类正正在用数据为将来的伙伴“加油”。

  具身智能机械人数据取锻炼担任人蒋将来告诉第一财经记者,三个月前,“那时候我们面对各类各样的挑和,好比灯光太亮导致画面,或者机械人手臂不小心碰着了不应碰的道具。”。

  此外,跟着财产的迸发,分歧构型机械人之间“方言欠亨”导致的数据孤岛问题日益凸显。分歧品牌的机械人传感器结构、关节度、节制接口各不不异,使得采集到的数据往往难以间接跨机型复用。为了打破这一面垒,数据正正在结构更多的采集手艺线。

  资产折旧、人员效率、损耗率,这三个要素间接决定命据成本。据引见,目前实机采集的数据每小时成本正在数百元至上千元不等,且涉及资产折旧和人力损耗。

  正在“婴儿护理”场景中,一台机械人正以较着慢于的速度,不寒而栗地给婴儿道具改换尿不湿。若是是正在实正在场景下,阿谁哇哇哭闹的婴儿生怕早就翻身爬走。不远处,正正在进修拾掇货架的机械人,每一次抓取和摆放,正在效率上还远远赶不上熟练的人类理货员。这些略显“稚嫩”的操做,也映照了了当前人形机械人财产最焦点的焦炙——数据量正在增加,但机械人离实正的“干活”,还要继续勤奋。

  据引见,70% 以上的产能用于办事行业客户,为模子锻炼、具身大脑研发供给焦点数据支持按照规划,这座正向着“100万小时高质量数据”的方针迈进。

  数据取锻炼一期,近5000平米的空间里,没有冰凉的流水线,而是复刻了家庭、商超、工业、医药、康养等线多台形态万千的。

  “你不克不及只是操做机械动起来,动做必需像人类一样天然、流利。”现场工做人员引见道。里还有不少正在“工业区”忙碌的机械臂,它们正正在进修分拣零件、拧螺丝,以至为将来的电力巡检做预备。

  正在更为复杂的“分析锻炼场”,不只复制了办公桌、卫生间,还特地搭建了冷冻区、烘焙区和酒水区。从家庭厨房的精细操做,到商超货架的从动理货,泛化、可复用”的准绳。

  里没有庞大的厂房,而是分隔出了一个个高度仿实的工做、糊口切片。人类操做员戴着VR头显或通过遥操做设备。

  正在“养老院”场景中,一台机械人正不寒而栗地为假人模特盖被子;转角处的“儿童房”,另一台机械则正在给婴儿改换尿不湿,厨房场景里,机械人正正在不寒而栗地清洗餐盘。这些动做看起来简单,但对机械人来说倒是高难度的“精细操做”。

  据引见,这些场景并非静态的“样板间”,而是可动态设置装备摆设、可组合沉构的“数据工场”。场景内的光照前提、物体摆放、人员动线均可按需调整,确保采集数据具备充实的泛化能力,可以或许笼盖算法锻炼所需的边缘案例取长尾场景。

  行业正正在摸索几种径:一是“无本体”采集线,即通过甚显、动捕设备等体例采集人类动做数据,再映照到分歧机械人身上;二是世界模子的摸索,试图从更底层的逻辑实现数据取机械人构型的解耦。

  他打了个例如:就像ChatGPT出来之前,没人能预测大模子需要多久冲破。对于人形机械人,乐不雅者感觉1到2年内会有量变,也有人认为需要更长时间。这是一个一层一层捅窗户纸的过程,每一层的冲破都需要时间,但一旦冲破了,手艺扩散的速度会很快。

  正在这个里,最忙碌的是人类操做员。数据采集涉及动做捕获、多模态同步、人工标注等环节,任何环节误差都可能产出“低质数据”,低质数据华侈资本以至模子。

  “我们最早是用实苹果锻炼的,但一全国来要耗损大量,成本太高且华侈。”蒋将来注释道,对于模子来说假生果和实生果不同不大。

  虽然数据的“及格率”正在攀升,但当记者实正走近这些正正在进修的机械人时,仍然能清晰地感遭到另一沉现实:从“会做”到“做好”,再到“像人一样快”,两头还隔着一段不短的距离。

  这背后履历了无数次的人员培训、问题逃溯取质量尺度优化,颠末几个月的磨合,现正在的及格率曾经不变正在95%。这意味着,每一条被采纳的数据,都必需是“示范动做”。

  想要实正走入千行百业,需要的是海量、多样、高质量的数据“原料”。此中,实机数据可以或许精准还原力觉反馈、触觉消息、干扰等仿实难以复制的细节,这些被称为“物理曲觉”的环节消息只能通过实机采集的多模态数据来锻炼。更主要的是,实正在中完整的使命闭环,一条简单的“抓取-操做-放置”轨迹中包含了大量人类正在复杂中的现性决策,其数据价值密度远高于其他类型的数据。

  蒋将来透露,目前支流客户的数据需求曾经达到“十万以至几十万小时”的量级,取客岁比拟“至多乘以10”。

  正在里,这种针对机械人的“沉浸式讲授”并非简单的遥控,而是“数据投喂”。工做人员透露,目前具有跨越120台设备,日产能达到400小时,正全力为内部算法团队及外部合做伙伴如机械人企业和大模子公司们,“投喂”着海量的锻炼数据。

  蒋将来对记者透露,目前也正在摸索“无本体”采集和遥操做舱等新模式。此中无本体的采集体例可以或许正在必然程度上解耦数据取特定机械人的强绑定关系,理论上能够扩大规模、处理数据孤岛问题,但它的无效性还需要更多查验。一旦跑通并达到取实机同样优异的锻炼结果,就能极大丰硕数据规模,鞭策同一数据买卖市场的构成。

  • 发布于 : 2026-06-01 06:03


0510-87061341 (售前)
0510-87076718 (售后)
0510-87076732 (技术)

微信公众号

微信服务号