为什么23andMe的基因数据可能成为AI公司的“金矿”Why 23andMe’s Genetic Data Could Be a 'Gold Mine' for AI Firms

环球医讯 / AI与医疗健康来源:www.aol.com美国 - 英文2025-03-26 04:00:00 - 阅读时长5分钟 - 2130字
基因检测公司23andMe宣布破产后,其拥有的1500万用户的基因数据可能被出售,这引起了AI公司的兴趣,但也引发了隐私和伦理问题。
23andMe基因数据AI公司破产数据出售医学研究行业价值伦理隐私数据主权声誉风险
为什么23andMe的基因数据可能成为AI公司的“金矿”

基因检测公司23andMe持有1500万人的基因数据,在经历了多年的财务困境后于周日晚上宣布破产。这意味着所有极其个人化的用户数据可能会被出售,而这一庞大的基因数据宝库可能会吸引那些希望训练其数据集的AI公司。

“数据是新的石油——而且这是非常高质量的石油,”天普大学福克斯商学院教授苏博达·库马尔说。“随着越来越多复杂和严谨算法的发展,这对许多公司来说是一个金矿。”

但任何试图收购23andMe的AI相关公司都将面临重大的声誉风险。许多人对将他们的基因数据用于追踪祖先,结果却被用于他们从未同意的方式感到震惊。

“任何人接触这些数据都存在风险,”库马尔说,他是福克斯商学院商业分析和颠覆性技术中心主任。“但与此同时,不接触这些数据,他们可能会失去一些重要的东西。”

阅读更多:23andMe申请破产。这对您的账户意味着什么?

训练LLM

像OpenAI和谷歌这样的公司已经投入大量时间和资源来在医疗领域产生影响,23andMe的数据宝库可能会吸引拥有足够财力进行收购的大型AI公司。23andMe本周的估值约为4800万美元,比2021年的峰值60亿美元大幅下降。

这些公司正努力构建最强大的通用模型,这些模型需要大量的详细数据进行训练。但研究人员指出,高质量的数据源正在枯竭,这使得新的、稳健的信息源更加珍贵。今年早些时候,TechCrunch对风险投资家的一项调查发现,超过一半的受访者认为“数据的质量或稀有性”是AI初创公司相对于竞争对手的优势。

“我认为对于一些大型AI公司来说,这可能是一个非常有价值的数据集,因为它代表了实际基因数据的真实数据,”Kazlauskas谈到23andMe时说。“一些生物出版物中可能存在的人为错误可以避免。”

库马尔表示,23andMe的数据在推动自主AI(即无需人类参与即可执行任务的AI)方面尤其有价值,无论是在医学研究还是公司决策中。

“自主AI模型的目标一直是模块化方法:你先解决小问题,然后将它们组合起来,”他说。

谷歌和OpenAI的代表没有立即回应置评请求。

行业价值

23andMe的数据在不同行业中也可能具有价值,这些行业使用AI来处理大量数据,首先是医学研究。

23andMe已经与葛兰素史克等制药公司达成协议,这些公司利用该公司的数据集希望能够开发出新的疾病治疗方法。库马尔说,在天普大学,他和他的同事们正在开展一个项目,为卵巢癌患者创建个性化治疗方案,并发现基因数据在理解之前无法理解的结构方面“非常、非常强大”。

然而,Insilico Medicine的创始人兼首席执行官亚历克斯·扎沃龙科夫认为,23andMe的数据可能并不像某些人想象的那么有价值,尤其是在药物发现方面。“大多数低垂的果实已经被摘取了,而且有大量的公开数据与主要学术论文一起发布,”他在给《时代》杂志的一封电子邮件中写道。

但许多其他行业的公司也可能会感兴趣。这是一个异常庞大且细致的数据集:这种数量的基因数据,尤其是带有个人健康和医疗记录的数据,很少能公开获取,Open Data Labs的首席执行官、Vana网络的创建者安娜·卡兹劳斯卡斯说。“所有这些上下文数据使其非常有价值——而且很难获得,”她说。

潜在感兴趣的行业包括保险公司,他们可以使用这些数据来识别具有更高健康风险的人,以提高保费。金融机构可以跟踪基因标记与消费模式之间的关系,以评估贷款。电子商务公司可以使用这些数据向患有特定疾病的人推送广告。

伦理和隐私问题

但公司在涉足这些数据时也面临着重大的声誉风险。2023年,23andMe遭受了一次黑客攻击,暴露了数百万用户的个人数据,严重损害了公司的声誉。库马尔说,来自其他行业的竞标者可能比23andMe更缺乏数据保护。“我担心的是,有些公司不习惯拥有这种类型的数据,他们可能没有足够的治理措施,”他说。

这种情况尤其危险,因为基因信息本质上是敏感的,一旦泄露就无法更改。自愿提供数据的人的家族成员的基因信息也处于风险之中。鉴于AI众所周知的偏见,这种数据的滥用可能导致在招聘、保险和贷款等领域出现歧视。周五,加州总检察长罗布·邦塔向23andMe客户发布了“紧急”警报,建议他们要求公司删除他们的数据并销毁其基因样本,根据加州隐私法。

电子前沿基金会的网络安全主任埃娃·加尔佩林担心,23andMe的基因数据可能在市场上处于永久流动状态。“一旦出售数据,就没有限制它可以被转售多少次,”她说。这可能导致基因数据落入那些可能不重视伦理考虑或没有强大的数据保护措施的组织手中。

Insilico Medicine的扎沃龙科夫表示,所有这些担忧意味着潜在的AI相关竞标者将不会尝试购买23andMe及其数据。“他们的数据集实际上是毒药,”他说。“无论谁购买它并对其进行训练,都会受到负面宣传,收购方可能会受到调查或起诉。”

无论最终发生什么,卡兹劳斯卡斯至少对这个困境引发了关于数据主权的更大讨论表示感谢。“我们未来应该希望避免这种情况,即你决定做一次基因测试,五年后,这家公司陷入财务困境,现在你的基因数据就有被卖给出价最高者的风险,”她说。“在这个AI时代,这些数据非常有价值。”


(全文结束)

大健康
大健康