美国国立卫生研究院(NIH)于2025年7月宣布推出GeneAgent,这是一款前沿的人工智能工具,有望彻底改变基因分析领域。GeneAgent基于大型语言模型(LLM)构建,旨在提高基因集分析的准确性。该工具解决了一个AI领域的重要挑战:即AI生成错误信息的问题,这种现象被称为“幻觉”。通过将其预测结果与专家整理的科学数据库进行比对,GeneAgent在基因分析中设立了新的标准。
GeneAgent的主要功能是生成基因集的功能描述,并对这些描述进行验证。它提供详细的验证报告,指明每一项描述是否得到数据支持、部分支持或被现有数据驳回。这种验证机制使GeneAgent在解释高通量分子数据方面比仅依赖推理的工具更为可靠。GeneAgent具备自我验证输出结果的能力,标志着AI技术的一大进步。
在性能方面,GeneAgent曾在1106个来自成熟数据库的基因集中进行测试。两位独立专家对其中10个基因集的132项声明进行了人工审核,结果显示,GeneAgent的判断准确率高达92%。相比之下,GPT-4等领先模型的自我验证准确率约为70%,并且存在更高的幻觉风险。GeneAgent与人类专家高度一致,且幻觉风险低,成为遗传分析领域值得信赖的工具。
GeneAgent的重要性在于其在医学和基因研究中提供准确可靠信息的能力。大多数大型语言模型缺乏内置的验证机制,这可能导致误导性结果。在医学研究中,任何不准确的信息都可能延缓科学发现,甚至误导关键决策。GeneAgent通过专家评审的反馈机制,实现了创新与信任之间的平衡,帮助研究人员生成可靠的信息,而无需担心传统AI工具常见的问题。
GeneAgent的实际应用已经显现。NIH团队使用来自小鼠黑色素瘤细胞系的7个基因集对该工具进行了评估。结果显示,GeneAgent揭示了潜在基因功能的新见解,这些信息可能指导未来的癌症疗法,或为新药靶点的发现提供线索。这凸显了GeneAgent的强大用途:它不仅能够验证信息,还能生成具有实践意义的研究路径。此外,GeneAgent也适用于非人类基因,其应用范围广泛。
GeneAgent的一项关键优势是通过外部验证机制减少AI生成的幻觉。它在基因集分析中与专家判断高度一致,并为包括肿瘤学和药物开发在内的实际遗传研究提供了有价值的见解。然而,GeneAgent的局限性在于其依赖所接入的数据库资源,且不具备人类般的推理能力。尽管如此,其集成的自我评估机制预示着一个AI成为研究伙伴的未来。
【全文结束】


