AI 见闻
精选· 重要性 3/5

我花一周录家务教机器人,谁才是机器?

Wired — AI··Reece Rogers·约 8 分钟阅读
中文导读

本文作者亲身体验为机器人训练提供第一人称家务视频的零工,揭示了这一新兴数据采集行业的现状、报酬与挑战。

我不再是一个单纯的人。我是现实的管道,信息的媒介。我手里拿着一把刀,弓着腰切一根有机黄瓜,这样绑在额头上的iPhone就能捕捉到全部十根手指。我把切片扔进沙拉碗,结束录制。在某个地方,一个机器人宝宝变聪明了一点点。

上个月,我在舒适的公寓里进行数据收集,教人形机器人如何擦盘子、叠衣服、倒饮料等琐碎任务,这就是我整整一周的生活。如果机器人要和我们住在一起并帮忙做家务,它们需要培养精细运动技能。我自豪地完成家务(当我收起运动裤时,通常不会为大规模数据集做贡献)。

我也很高兴赚了一些钱。随着越来越多的公司试图构建机器人并改进其AI模型,第一人称视频(用安装在头部或胸部的摄像头拍摄)的需求越来越大。

尽管互联网上充斥着可抓取的视频,但超特定的剪辑——比如数千个特写镜头显示双手将水倒入玻璃杯而不溢出——对于微调机器以在现实世界中表现出色至关重要。

这种被业界称为“以自我为中心数据”的记录方式需求如此之高,以至于一些投资者估计领先公司将在未来几年内从第三方供应商购买数亿小时的数据。

“我希望地球上的每个人都能记录自己洗碗的样子,”数据收集市场Kled的22岁创始人Avi Patel说。“这将造出一个机器人,让你再也不用洗碗了。

”在印度等国家,以自我为中心的数据收集已经在增长,这些国家的自雇者平均月收入约为125美元,而这些第一人称视频零工也能提供类似的报酬。随着兴趣高涨,更多数据收集公司正寻求在美国扩张,例如DoorDash今年早些时候推出的独立Tasks应用。

不久之后,美国许多零工工人可能开始提供现实数据来维持生计,就像送室温外卖一样。幸运的是,我在测试DoorDash的Tasks应用时已经拥有一个智能手机头戴支架。即使在那时,我的印象是定制视频数据是零工工作的反乌托邦未来,但我想更好地了解这个不断发展的行业。

由于Tasks在我居住的加州不可用,我注册了其他三个平台:Kled、Luel和Waffle Video。我赚的钱很少。我基本上是免费训练机器人,没怎么减轻我和伴侣分摊的每月2500美元旧金山房租。

但零工确实有一个意想不到的好处:我的公寓从未如此干净。

Kled的突破时刻发生在今年早些时候,Patel在X上发布了一段视频,展示了公司广泛视频数据档案的一小部分。该视频迅速被观看超过400万次,数据购买者开始打爆Patel的电话。“每个主要的基础模型和实验室都联系我要数据,”他告诉我。

机器人训练数据只是Kled从其超过30万用户收集的数据的一部分——这家初创公司主要付钱让人们上传整个相机胶卷作为AI训练数据。Patel看到早期采用者在马来西亚从事零工,并且有一个“特殊任务”部分来帮助促进视频提交。

用户从列表中选择他们想要拍摄的家务,然后直接通过应用录制内容。这些任务没有列出时薪;每个都标为低、中或高报酬,没有具体范围。(公司表示,大约一个月内,更新将包含许多(但不是全部)任务的费率。)我选择了“倒垃圾”作为我在Kled上的第一个机器人训练任务。

它被标记为“中等报酬”。开始很容易,因为应用会指导用户录制什么:描述:捕捉你如何清理家庭垃圾,以帮助训练现实世界的机器人工作流程。任务要求:录制一段连续的应用内视频,显示:取出袋子、系好袋子、放入新衬垫、扔掉垃圾。

保持相机稳定,避免拍摄面部。

我把智能手机带子套在头上,一边拍摄,一边系好厨房垃圾袋,护送它到公寓后面的小巷垃圾箱。我有点担心可能撞到邻居,不得不解释我在做什么。在我能重新放好衬垫之前,录制在大约两分钟时自动关闭,因为应用说我达到了限制。

Patel表示,过去一年Kled最重要的关注点是欺诈检测。人们经常尝试上传从互联网下载的视频以及空白黑框。还有隐私问题:“你必须确保所有数据都是匿名的,并删除个人身份信息,因为如果你不这样做,实验室就不会向你购买,”他说。

“任何不良上传也一样。你只需要过滤掉所有这些东西。”Patel说,Kled最近退出了尼日利亚,因为大约95%的用户提交的上传要么是无用的重复内容,要么是欺诈性的。

我在Kled上完成了九项任务,在周末家务中断断续续地录制,然后意识到应用要求用户上传100条媒体才有资格获得任何形式的付款。我有点恼火,决定上传去年度假的90多张照片来达到支付门槛。由于Kled需要几天时间处理数据,我转向其他收集机器人训练数据的平台,同时等待拿到钱。

Luel是一个向世界各地用户付费获取数据的平台,与Kled非常相似。两家公司都有年轻的创始人:Luel的William Namgyal今年早些时候加入Y Combinator时年仅18岁。两家公司都收集各种数据,不仅仅是自拍视频。

“人们愿意录制自己用母语说台词的简单片段,”Namgyal谈到Luel对语言保存的兴趣时说。“为什么不扩展到以自我为中心的视频和文档呢?”该应用现在还向用户付费,要求他们录制电脑屏幕并上传收据照片。

在我的测试中,Luel的设计感觉比Kled更笨重。该平台不按家务类型分配工作;它只有一个“从第一人称视角记录任何动手活动”的列表,提供每小时6.60美元的视频报酬。(相比之下,美国联邦最低工资是每小时7.25美元。

)Luel的要求非常具体——仅限头戴式、广角摄像头水平放置、最低1080p分辨率、95%的时间手部可见。我重新把手机绑在头上,开始在厨房工作,擦洗盘子并放入洗碗机。我向Luel的网站提交了一段五分钟的视频;

一天后被拒绝。“你的手在足够多的帧中不可见,”Luel的解释写道。一开始我什么也没得到。几天后,Luel给我发了一封电子邮件,推翻了最初的决定。

邮件解释说,虽然我的“在采样帧中手部可见度为83%”,但我满足了列表的其他要求,Luel实际上会支付。我多了55美分。Waffle Video无疑是我最喜欢的平台。

与Kled和Luel不同,它只专注于视频训练数据,我在应用中看到的“任务”,比如系鞋带和倒水,每小时视频支付25美元。这才像话。用户创建的每个数据集都是为购买数据的公司定制的,因此Waffle的“任务”只在有限时间内可用。

如果零工工人的视频被重新授权给其他公司,该应用还为他们提供经常性收入——本质上是一种联合模式。“我认为有一个绝佳的机会,可以在提供数据的人和需要数据的人之间建立共生关系。

原文出处
I Spent a Week Recording Myself Doing Chores for Money. Who's the Robot Now?

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。

相关阅读