深度观察:中国机器人产业如何通过海量实境数据,开辟智能未来

中国机器人产业正以独特的策略,通过大规模、低成本的本土化实境数据采集,加速其智能机器人技术发展,尤其在家庭和工厂应用场景中展现出显著的规模化优势。

深度观察:中国机器人产业如何通过海量实境数据,开辟智能未来

中国在本土化、低成本的家庭与工厂数据采集中占据规模优势,这与美国侧重研发及外包的策略形成鲜明对比。

王丹尼(Daniel Wang,音译)回到北京的公寓时,一台人形机器人正在家中等候。他推开门,机器人便开始忙碌起来。

这台由深圳一家机器人公司研发的机器人在操作中显得有些迟缓,它花费一小时折叠了大约三件衣物,又用另一小时整理了王先生的鞋子。大部分实际家务仍由随行的专业家政人员完成。

然而,这台机器人的核心任务并非执行家务,而是从真实家庭环境中收集训练数据。“对于展示这些家庭场景,我个人可以接受,”王先生表示。他为这项三小时的服务支付了149元人民币(约合22美元),并认为自己“为实体AI贡献了一份力量。”

全球机器人技术的发展正受制于复杂视觉与运动信息训练数据的短缺。尽管行业初期通过遥操作技术来训练机器人——即由人类反复操作机器人完成折叠衣物或使用微波炉等任务——但这种方法成本高昂且耗时,同时无法让机器人充分适应多变的现实环境。

当前,中国科技企业正探索创新途径,以在真实场景中生成训练数据。得益于国内相对较低的劳动力成本、政府的政策支持以及公众对机器人技术发展的热情,该行业正动员大量人口参与到机器人数据采集中。

今年以来,全球机器人开发者已大幅加快在真实家庭、零售门店和工厂中收集数据的步伐,尤其是通过“自我中心”数据——即以第一人称视角记录人类双手执行各类任务的视频。

业内分析人士指出,面对高昂的劳动力成本,美国企业已将此类数据采集任务外包给发展中国家的工人;相比之下,中国企业能够大规模地在本土收集数据,这有望帮助它们开发出更适应国内环境的机器人。

例如,一家知名电商平台正与宿迁市政府合作,计划在未来两年内生成1000万小时的机器人训练数据。

在一个专门的“数据采集社区”中,居民通过拍摄自己做家务的视频来获取报酬。根据国内媒体报道,当地一家养老中心和一家奇异果农场的员工也被招募,佩戴头戴式摄像头记录工作时的手部动作。

该电商平台表示,计划最终将动员10万名内部员工和50万名外部工作人员参与其数据采集业务。该公司将此项目誉为帮助当地居民增加收入的一种途径。

机器人开发者也与工厂合作,收集流水线工作数据。广东这一制造业重镇的两家数据服务商透露,他们正与数十家电子和包装工厂合作,让工人佩戴包括头戴式摄像头和腕部传感器在内的数据采集设备,以记录手部动作。

东莞一家数据供应商的负责人林卡森(Carson Lin,音译)表示,部分工厂主对此抱有顾虑,担心额外的操作会降低工人效率。除了支付数据费用,林卡森还向工厂强调了长远益处:经过训练的机器人未来将能在这些工厂中工作。

业内分析师马可·王(Marco Wang,音译)指出,获取多样化的训练数据将是中国机器人产业的一大优势。王先生认为,美国在顶尖AI人才和机器人模型研究方面处于领先地位,但在“硬件和数据生态系统方面,中国则占据主导地位。”

然而,这些数据采集方法是否能催生真正智能的机器人,目前仍是一个悬而未决的问题。一位机器人学教授指出,鉴于大型语言模型通过海量数据训练取得了成功,科技行业正将同样的规模化逻辑应用于机器人领域。

但目前尚无充分证据表明,遥操作数据和自我中心视频能训练出在任意环境中都能有效运作的机器人。“这并非一个异想天开的设想,”该教授表示,“只是尚未得到充分验证。”

尽管如此,这些数据采集工作在当前失业率上升的背景下,创造了新的就业机会。50多岁的全职妈妈高波每天拍摄自己做家务六小时,每小时收入20元人民币(约合3美元)——这是一种罕见的,让她在照顾青春期儿子的同时也能工作的机会。

高波表示,她位于山东省的公寓因每天反复打扫而变得一尘不染。“以前从来没有人付钱让我做饭洗衣服,”她说道。

返回 | FIRST CLASS VIP Lounge 专属情报频道