摘要
本研究旨在开发一款预测牙科治疗时间的桌面应用,通过机器学习算法评估模型准确性及临床效能。研究采用Python编程语言结合谷歌搜索API进行预测建模,训练数据包含2500例病例,测试数据250例。斯皮尔曼相关系数达0.96(p<0.001),R²值为0.97表明实际时间可解释97.32%的预测变化,平均绝对误差仅2.6432分钟。研究发现患者年龄和性别对预测无统计学影响,机器学习技术可有效优化医疗流程,谷歌API的集成可在缺乏训练数据时提供可靠补充,电子病历系统是医疗AI应用的基础条件。
方法创新
本研究构建的混合预测系统包含三大核心模块:
- 机器学习核心:采用双层建模架构,对≥5例数据的治疗项目(如根管治疗)建立线性回归模型(代码示例:
LinearRegression().fit(X_encoded, y)
),数据稀疏项目使用预设均值回退机制。 - 实时数据检索:通过SerpApi实现谷歌搜索实时调用(参数示例:
"procedure_name dental procedure duration minutes"
),采用正则表达式提取搜索结果中的时间信息并标准化为分钟单位。 - 临床安全机制:内建治疗时间下限字典(如拔牙≥8分钟),专科医生预测结果可应用修正系数(如根管治疗专科医生预测值减少40%)。
系统优化特点:
- 动态列对齐技术避免重复数据处理
- 实时预测时构建最小数据帧
- 各治疗项目模型并行训练
数据采集与分析
数据来自伊拉克苏莱曼尼亚大学牙科学院及私人诊所,收集变量包含:
- 实际治疗时间(经治医生记录)
- 牙医专业领域(专科医师/全科/研究生)
- 从业年限
- 患者人口学信息
训练集2500例经规范化处理:
- 排除字段缺失完整记录
- 术语统一处理(如"filling"与"restoration"合并)
测试集250例由软件预测并人工复核,采用SPSS 29及DATAtab进行统计分析:
- 配对t检验
- R²评分
- 平均绝对误差(MAE)
设定p<0.05为显著标准
核心发现
- 预测精度:R²值0.97(图3),MAE 2.6432分钟,较数据标准差24.93分钟具有显著优势
- 影响因素分析:
- 医师专业领域对预测有显著影响(F(1,250)=86, p<0.001)
- 年龄(r=−0.02, p=0.763)与性别对预测无显著影响
- 临床验证:各牙科治疗项目的Wilcoxon符号秩检验均显示实际与预测时间无显著差异
实践意义
- 流程优化:模型预测时间可作为排班系统基准,减少患者等待时间
- 技术整合:谷歌API的离线补充机制(当训练数据<5例时自动启用)提升系统适应性
- 跨学科应用:CSV数据接口支持移植到其他医学领域
局限性与展望
研究局限:
- 数据采集依赖人工录入
- 训练数据集中苏莱曼尼亚地区数据占主导
- 谷歌API依赖外部数据源稳定性
未来方向:
- 经济效益评估(包含资源优化成本节约)
- 集成电子病历系统实现实时更新
- 引入深度学习处理复杂病例模式识别
结论
- 机器学习在牙科时间预测中展现卓越性能
- 混合模型平衡计算效率与临床可靠性
- Python生态系统为医疗AI开发提供强大支持
- 电子病历系统是医疗智能化基础
数据可用性
训练数据集及源代码可通过通讯作者申请获取,保留部分版权要求。
【全文结束】