相关研究称AI医疗诊断准确率已与初级医生相当

【太平洋科技快讯】近日，据大阪都会大学医学研究生院主导的研究显示，生成式人工智能 (AI) 在医疗诊断领域的表现已与初级医生相当，但在面对专家级医生时仍存在一定差距。

该研究团队对 18,371 项相关研究进行了细致的筛选，最终确定了 83 项进行深入分析。研究涵盖了多种前沿的生成式 AI 模型，包括 GPT-4、Llama3 70B、Gemini 1.5 Pro 和 Claude 3 Sonnet 等，其中 GPT-4 成为研究的焦点。

研究结果显示，这些生成式 AI 模型的平均诊断准确率为 52.1%(95% 置信区间：47.0% - 57.1%)。值得注意的是，部分 AI 模型的诊断准确率已与非专家医生(初级医生)相当，两者之间没有显著统计差异(准确率差异：0.6% [95% 置信区间：-14.5% 至 15.7%]，p=0.93)。这表明，在诊断的准确性方面，AI 已具备替代部分初级医生工作的潜力。

然而，专家医生在诊断能力上仍然显著优于 AI，其准确率差距为 15.8%(95% 置信区间：4.4% - 27.1%，p=0.007)。这表明，在面对复杂和具有挑战性的病例时，专家医生的丰富经验和专业知识仍然是 AI 难以企及的。尽管如此，研究人员指出，随着生成式 AI 技术的不断发展，这一差距有望逐渐缩小。

研究还发现，AI 在大多数医学专科的表现较为一致，但在皮肤科和泌尿科领域，AI 的诊断能力尤为突出。此外，研究人员强调，生成式 AI 在医学教育领域也具有巨大的潜力。AI 可以模拟真实病例，帮助医学生和受训者学习和评估他们的技能，从而提高医学教育的效率和质量。透明度和偏见问题引关注，未来发展需多重验证

尽管生成式 AI 在医疗领域展现出巨大的潜力，但研究也对其透明度和偏见问题提出了担忧。许多 AI 系统并未公开其训练数据的详细信息，这引发了关于其结果是否适用于所有人群的疑问。研究人员强调，提高 AI 决策的透明度，确保其符合伦理标准，是未来发展的关键。此外，未来的研究需要在更复杂的临床场景中进行评估，使用实际病历进行性能评估，并在不同患者群体中进行验证，以进一步证实 AI 的能力。

玩酷网

相关研究称AI医疗诊断准确率已与初级医生相当

科技太平洋