如果您的人工智能看起来更聪明,那要归功于更聪明的人类训练师If your AI seems smarter , it's thanks to smarter human trainers

环球医讯 / AI与医疗健康来源:www.channelnewsasia.com新加坡 - 英语2024-09-29 06:00:00 - 阅读时长5分钟 - 2171字
在竞争激烈的人工智能领域,模型的更复杂更新需要具有专业知识的人类训练师,一些公司如Invisible Tech为多家AI公司提供训练服务以减少错误。
人工智能人类训练师ChatGPTCohereInvisibleTech减少幻觉专业知识高薪数据标注OpenAIAI21微软ScaleAI
如果您的人工智能看起来更聪明,那要归功于更聪明的人类训练师

在早期,要让像ChatGPT或其竞争对手Cohere这样的人工智能模型吐出类似人类的回应,需要大量低成本的工作人员帮助模型区分基本事实,比如图像是汽车还是胡萝卜。

但在竞争激烈的人工智能领域,模型更复杂的更新现在需要一个迅速扩大的具有专业知识的人类训练师网络,从历史学家到科学家,有些拥有博士学位。

Cohere的联合创始人Ivan Zhang谈到其内部的人类训练师时说:“一年前,我们可以雇佣本科生来一般性地教人工智能如何改进。现在我们有有执照的医生教模型如何在医疗环境中表现,或者有金融分析师或会计师。”

为了进行更多的训练,上次估值超过50亿美元的Cohere与一家名为Invisible Tech的初创公司合作。Cohere是OpenAI的主要竞争对手之一,专门为企业提供人工智能服务。

这家初创公司Invisible Tech雇佣了数千名远程工作的训练师,并已成为从AI21到微软等人工智能公司的主要合作伙伴之一,以训练他们的人工智能模型减少错误,在人工智能领域被称为幻觉。

Invisible的创始人Francis Pedraza说:“我们在全球100多个国家拥有5000人,他们是博士、硕士学位持有者和知识工作专家。”

Invisible根据工人的位置和工作的复杂性,每小时支付高达40美元。一些公司如Outlier每小时支付高达50美元,而另一家名为Labelbox的公司表示,对于像量子物理这样的“高专业知识”主题,每小时支付高达200美元,但基础主题的起薪为15美元。

Invisible成立于2015年,是一家为食品配送公司DoorDash等提供服务的工作流程自动化公司,以将其配送菜单数字化。但在2022年春天,在ChatGPT公开发布之前,一个相对不知名的研究公司OpenAI联系了他们,情况发生了变化。

Pedraza告诉路透社:“OpenAI来找我们时带着一个问题,就是当你向早期版本的ChatGPT提问时,它会产生幻觉。你不能相信答案。他们需要一个先进的人工智能训练合作伙伴来提供基于人类反馈的强化学习。”

OpenAI没有回应置评请求。

生成式人工智能根据用于训练它的过去数据生成新内容。然而,有时它无法区分真假信息,并产生被称为幻觉的错误输出。在一个显著的例子中,2023年,谷歌的一个聊天机器人在一个宣传视频中分享了关于哪个卫星首先拍摄到地球太阳系外行星的不准确信息。

人工智能公司意识到幻觉可能会破坏生成式人工智能对企业的吸引力,并正在尝试各种方法来减少它,包括使用人类训练师来教授事实和虚构的概念。

自从与OpenAI合作以来,Invisible表示它已成为包括Cohere、AI21和微软在内的大多数生成式人工智能公司的人工智能训练合作伙伴。Cohere和AI21证实他们是客户。微软未确认它是Invisible的客户。

Pedraza说:“这些都是有培训挑战的公司,他们的首要成本是计算能力,其次是优质培训。”

它是如何工作的?

引发了生成式人工智能热潮的OpenAI,有一个恰当地名为“人类数据团队”的研究团队,与人工智能训练师合作,为其像ChatGPT这样的模型收集专门的数据进行训练。

一位熟悉该公司流程的消息人士称,OpenAI的研究人员进行各种实验,如减少幻觉或改进写作风格,并与Invisible和其他供应商的人工智能训练师合作。在任何时候,都有数十个实验正在进行,有些使用OpenAI开发的工具,有些使用供应商的工具。

根据人工智能公司的需求——从更好地了解瑞典历史或进行金融建模——Invisible为这些项目雇佣具有相关学位的工人,减轻了人工智能公司管理数百名训练师的负担。

Pedraza说:“OpenAI拥有世界上一些最令人难以置信的计算机科学家,但他们不一定是瑞典历史、化学问题、生物学问题或任何你可以问它的问题的专家。”并补充说,仅为OpenAI就有超过1000名合同工。

Cohere的Zhang说他个人使用了Invisible的训练师来找到一种方法,教其生成式人工智能模型从大数据集中找到相关信息。

竞争

在这个领域的竞争对手之一是Scale AI,一家私人初创公司,上次估值为140亿美元,为人工智能公司提供训练数据集。它也涉足提供人工智能训练师的领域,并将OpenAI视为客户。Scale AI没有回应对此故事的采访请求。

自2021年以来一直盈利的Invisible仅筹集了800万美元的原始资本。

Pedraza说:“我们70%由团队拥有,只有30%由投资者拥有。我们确实促进了第二轮融资,最近的交易价格估值为5亿美元。”路透社无法证实该估值。

人类训练师最初通过数据标注工作进入人工智能培训,这项工作要求较低的资格,报酬也较低,有时低至2美元,主要由非洲和亚洲国家的人完成。

随着人工智能公司推出更先进的模型,对专业训练师和多种语言的需求正在上升,创造了一个高薪的利基市场,来自各种学科的工人可以成为人工智能训练师,甚至不需要知道如何编码。

人工智能公司的需求导致了更多提供类似服务的公司的创建。

Zhang说:“我的收件箱基本上被到处涌现的新公司淹没了。我确实认为这是一个新的空间,公司雇佣人类只是为像我们这样的人工智能实验室创建数据。”

来源:路透社

大健康
大健康