PodGPT:AI模型通过学习科学播客更好地回答问题PodGPT: AI model learns from science podcasts to better answer questions

环球医讯 / AI与医疗健康来源:phys.org美国 - 英文2025-07-15 14:31:36 - 阅读时长3分钟 - 1123字
波士顿大学研究人员开发了一种名为PodGPT的AI模型,该模型通过学习科学和医学播客中的语音内容,提升了在科学、技术、工程、数学和医学领域中回答问题的能力,并有助于多语言知识传播和更贴近人类真实对话的理解。
PodGPTAI模型科学医学播客健康医学知识健康状况理解诊断公共卫生行星健康教育决策信息获取
PodGPT:AI模型通过学习科学播客更好地回答问题

生成式人工智能(AI),特别是大型语言模型(LLMs)的兴起,在数据分析、解释和内容生成方面标志着一场变革性的转变。这些模型经过大量文本数据集的训练,展现出生成语境准确且语言丰富的输出能力,对科学和医学等领域产生了深远影响,例如OpenAI的GPT-4就表现出了卓越的能力。

然而,LLMs在科学、技术、工程、数学和医学(STEMM)领域的全部潜力仍未被充分挖掘,尤其是在整合非传统数据模式(如音频内容)方面。

在一项新研究中,波士顿大学的研究人员介绍了一种名为PodGPT的新计算机程序,该程序通过学习科学和医学播客,变得更加智能,能够更好地理解和回答科学问题。这项研究发表在《npj生物医学创新》期刊上。

“通过整合口语内容,我们旨在增强模型对会话语言的理解,并将其应用扩展到STEMM学科中更专业的场景,”通讯作者Vijaya B. Kolachalama博士解释道。他是波士顿大学Chobanian & Avedisian医学院医学与计算机科学副教授,同时也是波士顿大学计算与数据科学学院创始成员以及Hariri计算研究所的附属研究员。

“这一研究的独特之处在于,它使用了真实的对话,例如专家访谈和讨论,而不仅仅是书面材料,这帮助模型更好地理解人们在现实生活中如何谈论科学。”

Kolachalama及其同事收集了超过3700小时的公开科学和医学播客,并使用先进软件将语音转换为文本。随后,他们训练了一个计算机模型,让其从这些信息中学习。

接着,研究人员测试了该模型在生物学、数学和医学等主题上的各种测验中的表现,包括不同语言的问题,以评估其性能。结果表明,整合STEMM音频播客数据增强了模型理解和生成精确且全面信息的能力。

研究人员表示,这项研究表明,像播客这样的语音内容可以用来训练AI工具。“这为使用各种音频内容(如讲座或访谈)构建更智能、更接近人类的技术打开了大门。此外,它还展示了让科学以多种语言普及的前景,帮助世界各地的人们学习并保持信息更新,”Kolachalama说道。

研究人员不仅相信这项技术将使科学和医学知识更容易获取,还认为听取领域专家的对话将帮助人们在健康和教育方面做出更明智的决策。

“这可能有助于改善对多种健康状况的理解和诊断,例如阿尔茨海默病、心血管疾病、传染病、癌症和心理健康问题。它还可能支持公共卫生和行星健康等领域的学习,”Kolachalama补充道。

更多信息:Shuyue Jia等人,《PodGPT:一种用于研究和教育的音频增强型大型语言模型》,《npj生物医学创新》(2025)。DOI:10.1038/s44385-025-00022-0

由波士顿大学医学院提供


(全文结束)

大健康
大健康