24岁小伙“倒腾数据”,将跻身硅谷最年轻亿万富豪行列
3 小时前 / 阅读约8分钟
来源:36kr
micro1公司从AI招聘助手转型为数据标注业务,估值飙升。AI训练数据标注市场蓬勃发展,安萨里认为未来几乎所有人都能成为AI训练师,并预测人形机器人数据市场将远超现有AI训练市场。

阿里·安萨里(Ali Ansari)决定将micro1的AI招聘助手转型为数据标注业务,这一举措让公司估值从8000万美元飙升至目前正在商讨的25亿美元。如今,他正致力于抢占人形机器人训练数据市场。

若要寻找人工智能市场泡沫的风向标,micro1的飞速崛起便是最直观的信号。

去年年初,它还只是一家年营收约700万美元的AI招聘服务商;而在转型AI训练数据标注业务八个月后,其年化营收已突破1亿美元,还收到了25亿美元估值的投资邀约(就在几个月前,该公司刚完成一轮融资,估值为5亿美元)。

这对公司年仅24岁的首席执行官阿里·安萨里而言,无疑是一段狂飙突进的历程,他也即将跻身全球最年轻亿万富豪之列。据《福布斯》估算,若micro1最终锁定或超过投资者当前洽谈的25亿美元估值,安萨里所持有的约42%公司股份,价值将超10亿美元。

01

安萨里最初对人工智能训练领域产生兴趣,是因为一家大型数据标注公司先前找上门来,寻求招聘方面的协助。

“这个项目彻底颠覆了我们的认知,”安萨里说,“我们当时就疑惑,这家公司为什么要在两周内招聘数百名工程师?那一刻我们意识到,天哪,我们真该深耕这个市场。”

于是,和同样以AI招聘服务起家的竞争对手Mercor一样,安萨里带领micro1转向了数据标注赛道。

AI训练——即对用于训练AI底层大语言模型的信息进行人工标注——是当前硅谷增长最快的领域之一。

要让AI模型变得“更聪明”,就需要人类为其训练数据添加语境和意义。由于AI的性能与其训练阶段所能接收的高质量数据量呈正相关,可供优质数据供应商争取的市场规模也随之迅速扩张。安萨里估算,目前各大AI实验室每年在AI训练上的投入达150亿美元,而他预计两年后这一数字将突破1000亿美元。

这是一个蓬勃发展的市场。数据标注领域究竟会成长为规模庞大、分支广阔的产业,还是会被足以实现自我训练的先进人工智能所取代,不同的人或许会给出不同的答案。但眼下,这无疑是一门大生意,仅过去几个月就催生出四位新晋亿万富豪——Mercor的创始团队以及Surge创始人Edwin Chen。

02

除微软(Microsoft)外,安萨里未披露其他具体客户,但他表示micro1与多家前沿人工智能实验室,以及“科技七巨头”中的大多数企业都有合作。这些客户都需要寻找领域专家,对从客户服务到投行业务等各类场景的训练数据进行标注。这类专家大多拥有高学历,负责评估AI输出内容,时薪在60至170美元之间,少数特殊领域的专家,如医疗或金融行业专业人士,时薪甚至可达500美元。

按照安萨里的设想,未来几乎所有人都能成为AI训练师,而不仅限于白领专家。他正在开发一项服务,付费让人们拍摄自己的日常活动,比如叠衣服,以此为机器人AI模型生成训练数据。

“AI训练正从根本上影响着经济,它是一个全新的职业领域。”他表示。

01A Ventures联合创始人、micro1投资人亚当·贝恩(Adam Bain)表示,不久前,数据标注还是一个“不受青睐、不被重视”的领域。

“当时市场共识是,这不是一个值得投资的赛道,”贝恩告诉《福布斯》,“早期的数据标注工作确实十分基础,但如今的核心要务已成了要找到比模型更聪明的人……这个领域已经变得非常复杂。”

投资者担心,AI一旦达到通用人工智能(AGI)的水平,并具备与人类相当的认知能力,数据标注行业便会走向消亡。此外,他们也不愿涉足那种需管理大量短期项目、协调大批外包人员的生意——这听着就没什么吸引力。

Altimeter Capital的合伙人贾敏·鲍尔(Jamin Ball)之前从未投资过任何数据标注公司。他表示:“我们当时担心的是,这个行业的蛋糕到底有多大。当时看起来,数据标注似乎就是一种没有差异化的业务,而这类业务在成熟后,利润率往往很低。”

不过,鲍尔现已改变想法,开始积极寻找数据类公司的投资机会。他表示,数据之于AI模型就像是氧气之于人类。

贝恩表示,创业者要想在数据标注行业取得成功,必须洞察AI市场多变的风向,这远比埃森哲(Accenture)快速搭建一个离岸呼叫中心要难得多。贝恩表示,安萨里极其擅长预测未来风向,并形容他拥有全方位投入的工作态度:无论是打造卓越公司、维护客户关系,还是高强度工作,他都保持着同等的热情。

03

十多年前,安萨里从伊朗移居洛杉矶,青少年时期就开始尝试创业。初中时,他就在eBay平台做起了转卖教科书的小生意。高中时,他开发了一个在线数学辅导平台,并在毕业时以“区区”六位数美元的价格出售并获利。

在伯克利读本科期间,他还经营着一家软件咨询公司,但苦于难以找到得力的海外工程师。为此,他用OpenAI的GPT-3模型开发了一个AI招聘助手,代替他与候选人沟通,并评估他们的技能水平。当这个AI招聘助手的年收入突破100万美元时,他关闭了软件咨询公司,全职投入这一项目。之后,他又带领公司转型进入数据标注领域。

Micro1的差异化优势在于安萨里提出的“以人为本” 理念,即优先考虑数据标注员的体验。招聘流程从AI面试开始,随后进行真实的工作模拟演练,这样一来,AI训练师就能提前知道未来的工作内容和要求。

录用后,AI数据标注专家会与一名“真人数据经理”进行匹配。这些数据经理通常是顶尖大学的应届毕业生,负责帮助专家适应AI训练相关的工作。micro1项目经理的部分薪酬与公司的“专家满意指数”(Expert Happiness Index)挂钩,而专家的业绩表现则通过详细的数据分析进行评估,并接受分级排名制管理。

安萨里表示:“专家越满意,产出的成果质量就越高,AI实验室也就能训练出更好的模型。”

04

尽管有批评者认为,数据标注员正在训练有朝一日可能会取代他们的AI,这种情形实在残酷。但安萨里认为,这一新兴就业领域反而会创造无数岗位,而且还会成为失业蓝领工人的福音。

最让安萨里感到兴奋的,是围绕先进机器人技术兴起的数据市场。他预测,这一市场未来的规模将会远远超过现在的AI训练市场。对于研发人形机器人的公司而言,并无现成的训练数据集可用,也不能像训练大语言模型那样,可在互联网上挖掘海量数据。这类数据不是从出版商或维基百科上就能抓取的那种,而是需要人为创造和采集才能获得。

为此,Micro1正向数据采集人员寄送包含Meta与雷朋(Ray-Ban)合作推出的Ray-Ban Meta智能眼镜在内的设备套件,让他们录制如整理床铺、修理漏水的水龙头或收拾碗盘等日常行为,从而为机器人创建基础数据集。

即使想让人形机器人有朝一日具备哪怕只有人类一半的能力,为其采集数据都将是一项浩大而繁杂的任务。这也正是安萨里对他所开拓的这片市场充满信心的原因。

安萨里表示:“要达成最理想的终极状态,唯一的方式就是对现实世界进行完美建模,而这永远也无法做到。”