【太平洋科技快讯】近日,据大阪都会大学医学研究生院主导的研究显示,生成式人工智能 (AI) 在医疗诊断领域的表现已与初级医生相当,但在面对专家级医生时仍存在一定差距。

该研究团队对 18,371 项相关研究进行了细致的筛选,最终确定了 83 项进行深入分析。研究涵盖了多种前沿的生成式 AI 模型,包括 GPT-4、Llama3 70B、Gemini 1.5 Pro 和 Claude 3 Sonnet 等,其中 GPT-4 成为研究的焦点。
研究结果显示,这些生成式 AI 模型的平均诊断准确率为 52.1%(95% 置信区间:47.0% - 57.1%)。值得注意的是,部分 AI 模型的诊断准确率已与非专家医生(初级医生)相当,两者之间没有显著统计差异(准确率差异:0.6% [95% 置信区间:-14.5% 至 15.7%],p=0.93)。这表明,在诊断的准确性方面,AI 已具备替代部分初级医生工作的潜力。
然而,专家医生在诊断能力上仍然显著优于 AI,其准确率差距为 15.8%(95% 置信区间:4.4% - 27.1%,p=0.007)。这表明,在面对复杂和具有挑战性的病例时,专家医生的丰富经验和专业知识仍然是 AI 难以企及的。尽管如此,研究人员指出,随着生成式 AI 技术的不断发展,这一差距有望逐渐缩小。
研究还发现,AI 在大多数医学专科的表现较为一致,但在皮肤科和泌尿科领域,AI 的诊断能力尤为突出。此外,研究人员强调,生成式 AI 在医学教育领域也具有巨大的潜力。AI 可以模拟真实病例,帮助医学生和受训者学习和评估他们的技能,从而提高医学教育的效率和质量。透明度和偏见问题引关注,未来发展需多重验证
尽管生成式 AI 在医疗领域展现出巨大的潜力,但研究也对其透明度和偏见问题提出了担忧。许多 AI 系统并未公开其训练数据的详细信息,这引发了关于其结果是否适用于所有人群的疑问。研究人员强调,提高 AI 决策的透明度,确保其符合伦理标准,是未来发展的关键。此外,未来的研究需要在更复杂的临床场景中进行评估,使用实际病历进行性能评估,并在不同患者群体中进行验证,以进一步证实 AI 的能力。