如果你住在达拉斯,你可能已经知道过敏季节非常严重。根据美国过敏和哮喘基金会2024年的报告,该市在美国过敏之都中排名前20位,其花粉评分、非处方抗过敏药物使用量以及过敏专科医生数量均位居第四。
现在,德克萨斯大学阿灵顿分校的研究人员正在利用人工智能来消除花粉追踪中的猜测工作,从树花粉开始。
在最近发表于《大数据前沿》期刊上的一项研究中,该大学的研究人员与弗吉尼亚理工大学和内华达大学里诺分校的科学家合作,开发了一种能够以约99%的准确率区分冷杉、云杉和松树花粉的人工智能系统。这三种针叶树在形态上非常相似。
尽管这一系统是朝着更快识别花粉方向迈出的重要一步,但在实际应用之前仍有许多工作要做,佛罗里达理工学院生物科学教授马克·布什(Mark Bush)表示。他没有参与这项研究。
“我认为[研究人员]做的一切都是正确的,”布什说。“但这仍然是一个巨大的步骤,”他补充道,在现实世界中,“有成千上万的花粉颗粒,还有你在样本中发现的所有杂质——所有的灰尘和有机碎片以及其他可能遮挡花粉颗粒的东西。”
目前,花粉识别依赖于专业知识和高分辨率显微镜下的视觉检查——这是一个耗时且有时容易出错的过程,德克萨斯大学阿灵顿分校生物学助理教授贝赫纳兹·巴尔马基(Behnaz Balmaki)表示。找到一种加速这一过程的方法是巴尔马基及其同事转向人工智能的原因。
教人工智能如何识别花粉颗粒需要向它提供数百张这些颗粒的图像。巴尔马基及其同事使用了来自内华达大学里诺分校自然历史博物馆的六种不同类型的冷杉、云杉和松树花粉颗粒的图片。这项工作涉及手动从博物馆的标本馆收集花粉颗粒,将多达400个花粉颗粒放在一张载玻片上,然后在显微镜下拍照。
“我们专注于像冷杉、云杉和松树这样的针叶树,因为它们在形状上非常相似,我们想看看模型在识别它们时的表现如何,”巴尔马基说。
德克萨斯大学阿灵顿分校数据科学系助理教授马苏德·罗斯塔米(Masoud Rostami)解释说,人工智能系统通过多个处理层学习如何区分花粉类型,类似于这些系统通过检测简单的特征如形状和边缘来训练识别面部,然后逐步识别更复杂的模式。这种分层方法使人工智能能够捕捉到冷杉、云杉和松树花粉之间的细微差别。
罗斯塔米说,每一层都有助于识别花粉颗粒的不同模式。层次越多,识别就越容易,但过程会变得更慢,计算成本也会更高。
巴尔马基、罗斯塔米及其同事评估了九种不同的人工智能模型,并选择了一种名为ResNet101的模型,他们发现该模型在性能和计算效率之间提供了良好的平衡。ResNet101在区分六种冷杉、云杉和松树花粉时的准确率为99%,使用了101层。其他一些模型使用的层数少至18层,而有些则多达201层。
巴尔马基希望这项研究能加速花粉识别过程,并提供精确到物种级别的结果。她和罗斯塔米设想,像他们这样的人工智能系统将来将在农业、公共卫生、城市规划等领域得到应用——任何需要花粉识别的地方。
“草是德克萨斯州的一个大问题,尤其是对过敏症患者来说,”罗斯塔米说。“关于草花粉的人工智能系统还没有任何论文、出版物或研究。这可以成为一个非常热门的话题,专注于草花粉颗粒的识别。”
佛罗里达理工学院的布什警告说,虽然人工智能系统在花粉识别方面显示出潜力,但要将其扩展到六种花粉之外将是一项艰巨的任务。对于南美洲等地区,那里有数百种不同的花粉类型,教会系统区分它们需要大量数据。此外,还有其他类似花粉的有机颗粒,如灰尘,会使情况更加复杂。
巴尔马基和罗斯塔米承认,要训练他们的人工智能识别超过六种树花粉还有很多工作要做。他们的下一步是训练它识别北德克萨斯本土的花粉。
“未来,我们计划覆盖整个美国,因为当这些数据准备好后,任何人都可以为他们的目的使用它,”巴尔马基说。“无论是用于考古研究、过敏研究,还是健康、授粉、蜂蜜质量甚至法医研究,都非常酷。”
(全文结束)


