贝丝以色列女执事医疗中心 (BIDMC) 的医师科学家报告说,ChatGPT-4 人工智能程序,在处理医疗诊断和临床推理方面,超过了两个学术医疗中心的,内科住院医师和主治医师。 该研究参照了,为评估医生而制定的 IDEA 评分标准,将大型语言模型(LLM)的推理能力,与人类表现进行了直接比较,结果显示ChatGPT-4得到了最高分。该研究发表在《美国医学会内科杂志》(JAMA Internal Medicine)上。