新加坡——长期以来,新加坡式英语(Singlish)一直是语音助手面临的一大障碍,因为新加坡使用的多种口音和语言给AI带来了挑战。然而,一个名为“AI新加坡语音实验室”的健康科技项目已经在教授AI模型新加坡版英语方面取得了进展。
其熟练掌握Singlish的大规模语言模型已部署在诊所中,并正在新加坡民防部队(SCDF)进行测试,以帮助995呼叫响应者转录电话,并提示接线员在紧急情况下提出关键问题。
南洋理工大学计算与数据科学专家郑英祥教授表示,该项目的AI模型最近实现了突破,可以动态转录包括英语、马来语和普通话在内的多种本地语言。
11月13日,该项目在新加坡国立大学举行的“AI在医疗技术展示会”上进行了展示,同时展示了其他15个旨在提高医疗行业效率的技术项目,包括聊天机器人和数字助理。
在Singlish中,混合使用多种语言和当地方言的俚语非常普遍,这种混合使得方言对于AI模型来说难以预测,也给程序员带来了挑战。“Singlish一直是本地开发人员的一大难题,”郑教授告诉《海峡时报》,“我们的口音和俚语对于现有的AI模型来说很难捕捉。”
他还补充说,新加坡有许多地名是大多数语音转文字模型无法识别的,例如蔡厝港、淡滨尼和巴哈路,这些词不在英语词典中。该AI模型已在SingHealth综合诊疗所部署,支持医务人员与患者的访谈。郑教授表示,出于隐私考虑,AI模型与互联网隔离,并完全在用户的计算机上执行转录。
现场演示显示,AI模型能够动态转录多种语言和重口音的Singlish术语,为接线员提供更准确的转录参考。郑教授指出,尽管市场上可能太小,不足以吸引科技公司投资解决本地代码切换问题,但该项目旨在填补这一空白。该模型的准确率约为90%,在有人类参与的情况下,这些录音足够可靠,供接线员做出合理的判断和分析。
AI新加坡和其他行业合作伙伴已为语音实验室提供了近500万新元的资金,至少为期五年。
同一技术还在另一个由AI新加坡资助的项目“智能电话分诊在院前急救护理”中进行测试。AI模型转录音频,自动填写接线员用于快速传递信息给其他部门的表格。这些信息包括呼叫者的姓名、年龄、位置和事件的具体情况。
该系统还会提示接线员提出后续问题,并建议行动,如在紧急情况下呼叫救护车。
医疗AI研究员何凯表示,AI模型有助于响应者提高在通话中记录关键细节的速度和准确性,因为任何错误都可能浪费资源或威胁到需要帮助的患者。为了教会AI理解Singlish以及一长串医学术语,研究人员收集了大量的数据。研究团队表示,这些数据包括来自当局和公共数据库的超过30万个通话记录样本,以及来自资讯通信媒体发展局的国家语音语料库——这是第一个大规模的新加坡英语数据库,旨在帮助研究人员和开发者改进对本地口音英语的理解。
世界各地的社区都在努力确保AI模型适应特定文化,以更好地代表当地群体。例如,冰岛正与ChatGPT制造商OpenAI合作,保护冰岛语并帮助非英语社区更有效地访问AI。同样,AI新加坡正在开发一系列名为Sea-Lion(东南亚语言一体化网络)的大规模语言模型,专门针对该地区的语言和文化。
在位于邵氏基金会校友会的医疗科技展示会上,卫生部长王乙康在开幕致辞中鼓励医疗行业战略性地采用AI。他表示,卫生部正在部署AI工具,如行政工具和成像技术,以帮助早期发现疾病,推动整个行业的效率提升并改善人们的健康状况。在一个项目中,AI正在接受训练,以分析伤口,并为慢性病患者提供及时的报告和建议。
AI还在新加坡中央医院(SGH)作为药剂师和医生的额外检查层进行测试,以建议药物选择。目前的模型作为NexRx.Ai项目的一部分,接受了糖尿病患者遇到的80%药物的培训,设计上能够向用户解释其推荐理由,确保决策透明。世界卫生组织表示,每年有130万人受到药物错误的影响,估计全球每年因药物错误造成的成本至少为400亿美元(约合530亿新元)。
(全文结束)


