新的人工智能方法捕捉医学图像中的不确定性

  • 发布时间:2024-04-22 16:39:53 来源:
标签:
导读 通过为一张医学图像提供合理的标签图,Tyche机器学习模型可以帮助临床医生和研究人员捕获关键信息。在生物医学中,分割涉及对医学图像中重...

通过为一张医学图像提供合理的标签图,Tyche机器学习模型可以帮助临床医生和研究人员捕获关键信息。

在生物医学中,分割涉及对医学图像中重要结构(如器官或细胞)的像素进行注释。人工智能模型可以通过突出显示可能显示某种疾病或异常迹象的像素来帮助临床医生。

然而,这些模型通常只能提供一个答案,而医学图像分割问题往往不是非黑即白的。五位专家人类注释者可能会提供五种不同的分割,可能对肺部CT图像中结节边界的存在或范围存在分歧。

“拥有选择可以帮助决策。即使只是看到医学图像中的不确定性也会影响某人的决定,因此考虑到这种不确定性很重要,”麻省理工学院计算机科学博士生MarianneRakic说。

Rakic与麻省理工学院、麻省理工学院和哈佛大学博德研究所以及麻省总医院的其他人共同发表了一篇论文,该论文介绍了一种新的人工智能工具,可以捕获医学图像中的不确定性。

该系统被称为“Tyche”(以希腊机会神命名),它提供了多个看似合理的分割,每个分割都突出显示医学图像中略有不同的区域。用户可以指定Tyche输出的选项数量,并选择最适合其用途的选项。

重要的是,Tyche可以处理新的分割任务,而无需重新训练。训练是一个数据密集型过程,涉及向模型展示许多示例,并且需要丰富的机器学习经验。

由于不需要再培训,Tyche比其他方法更容易被临床医生和生物医学研究人员使用。它可以“开箱即用”地应用于各种任务,从识别肺部X射线中的病变到查明大脑MRI中的异常情况。

最终,该系统可以通过引起人们对其他人工智能工具可能错过的潜在关键信息的关注来改善诊断或帮助生物医学研究。

“模糊性尚未得到充分研究。如果你的模型完全忽略了一个结节,而三位专家认为存在而两位专家认为不存在,那么这可能是你应该注意的事情,”哈佛医学院和麻省总医院助理教授AdrianDalca和一项研究的资深作者AdrianDalca补充道。麻省理工学院计算机科学与人工智能实验室(CSAIL)的科学家。

他们的合著者包括HalleeWong,一名电气工程和计算机科学专业的研究生;何塞·哈维尔·冈萨雷斯·奥尔蒂斯博士'23;BethCimini,布罗德研究所生物图像分析副主任;约翰·古塔格(JohnGuttag),杜格尔德·杰克逊(DugaldC.Jackson)计算机科学和电气工程教授。Rakic将在IEEE计算机视觉和模式识别会议上展示Tyche,Tyche被选为该会议的一大亮点。

解决歧义

用于医学图像分割的人工智能系统通常使用神经网络。神经网络松散地基于人脑,是一种机器学习模型,由许多互连的节点或神经元层组成,用于处理数据。

在与使用这些系统的布罗德研究所和麻省总医院的合作者交谈后,研究人员意识到有两个主要问题限制了它们的有效性。这些模型无法捕捉不确定性,即使是稍微不同的分割任务也必须对其进行重新训练。

拉基奇说,一些方法试图克服一个陷阱,但事实证明,用单一解决方案解决这两个问题特别棘手。

“如果你想考虑模糊性,你通常必须使用极其复杂的模型。通过我们提出的方法,我们的目标是使其易于使用相对较小的模型,以便它可以快速做出预测,”她说。

研究人员通过修改简单的神经网络架构构建了Tyche。

用户首先向Tyche提供一些显示分割任务的示例。例如,示例可能包括心脏MRI中的多个病变图像,这些图像已由不同的人类专家分割,以便模型可以学习任务并发现是否存在模糊性。

研究人员发现,只需16个示例图像(称为“上下文集”)就足以让模型做出良好的预测,但可以使用的示例数量没有限制。上下文集使Tyche无需重新训练即可解决新任务。

为了让Tyche捕捉不确定性,研究人员修改了神经网络,使其根据一张医学图像输入和上下文集输出多个预测。他们调整了网络的层,以便当数据从一层移动到另一层时,每一步生成的候选分割可以彼此“对话”并与上下文集中的示例“对话”。

通过这种方式,模型可以确保候选分割都有点不同,但仍然可以解决任务。

“这就像掷骰子。如果你的模型可以掷出二、三或四,但不知道你已经有二和四,那么其中任何一个都可能会再次出现,”她说。

他们还修改了训练过程,以便通过最大限度地提高最佳预测的质量来获得奖励。

如果用户要求五个预测,最后他们可以看到Tyche生成的所有五个医学图像分割,即使其中一个可能比其他更好。

研究人员还开发了Tyche的一个版本,可以与现有的预训练模型一起用于医学图像分割。在这种情况下,Tyche使模型能够通过对图像进行轻微的变换来输出多个候选者。

更好、更快的预测

当研究人员使用带注释的医学图像数据集测试Tyche时,他们发现它的预测捕捉到了人类注释者的多样性,并且它的最佳预测优于任何基线模型。Tyche的性能也比大多数模型更快。

“输出多个候选人并确保他们彼此不同确实会给你带来优势,”拉基奇说。

研究人员还发现,Tyche的性能可能优于使用大型专业数据集训练的更复杂的模型。

对于未来的工作,他们计划尝试使用更灵活的上下文集,可能包括文本或多种类型的图像。此外,他们希望探索可以改进Tyche最差预测并增强系统的方法,以便它可以推荐最佳的分割候选者。

  • 免责声明:本文由用户上传,如有侵权请联系删除!