儿童腕部创伤X射线图像骨折检测

时间:2024-12-11 06:57:59

????作者主页:点击! 

????编程探索专栏:点击!

⏰️创作时间:2024年12月10日14点02分


神秘男子影,
  秘而不宣藏。
泣意深不见,
男子自持重,
   子夜独自沉。

论文链接

点击开启你的论文编程之旅https://www.aspiringcode.com/content?id=17326327482279&uid=a466161c2c2144f894a37c5a894fe977

引言

X射线图像的准确解读对手术的成功至关重要。然而,一些地区缺乏经验丰富的放射科医生,这带来了挑战。计算机辅助诊断(CAD)帮助放射科医生和外科医生等专家解读医学图像,包括磁共振成像(MRI)、计算机断层扫描(CT)和X射线图像。但由于其预测准确性的不确定性,不能完全依赖于它作为唯一的检测手段。

随着深度学习在计算机视觉任务中的快速发展,其在医学图像处理中的应用也取得了令人满意的结果。You Only Look Once(YOLO)系列是实时目标检测任务的主要神经网络,广泛应用于骨折检测。儿童腕部骨折是更常见的病例,GRAZPEDWRI-DX数据集提供了20,327张儿童腕部创伤的X射线图像,可用于骨折检测任务。

随着YOLOv9的推出,在MS COCO 2017基准数据集上取得了显著的模型性能提升,mAP从YOLOv8的53.9%提高到55.6%。本文首次在GRAZPEDWRIDX数据集上训练YOLOv9模型,并获得了最先进的性能。

YOLOv9

YOLOv9模型是为了解决在多层特征提取和空间转换过程中的信息丢失问题而设计的。尤其在X射线图像中,由于特征较少,信息丢失问题尤为突出,这会严重影响骨折检测任务的性能。YOLOv9通过以下两个关键组件来更有效地提取关键特征,从而解决信息丢失问题。

可编程梯度信息

PGI(Programmable Gradient Information)是一个辅助监督框架,用于管理不同语义层次上的梯度信息传播,以提高模型的检测能力。PGI包括三个主要部分:主分支、辅助可逆分支和多级辅助信息。在推理过程中,仅使用主分支,负责前向和反向传播。当网络变得更深时,可能会出现信息瓶颈,导致损失函数无法产生有用的梯度。在这种情况下,辅助可逆分支使用可逆函数来保持信息完整性,并减少主分支中的信息丢失。此外,多级辅助信息通过在不同层次引入补充信息来解决深度监督机制中的误差累积问题,从而提高模型的学习能力。PGI在训练过程中具有保持信息的作用,尤其是在特征有限的场景中,这为YOLOv9模型在骨折检测任务中表现出色提供了理论基础。

广义高效层聚合网络

为了提高模型训练中的信息集成和传播效率,YOLOv9引入了一种新的轻量级网络架构GELAN(Generalized Efficient Layer Aggregation Network)。GELAN整合了CSPNet和ELAN,以高效地聚合网络信息,减少传播中的信息丢失,并增强层间信息交互。这种架构特别适合于在计算资源有限的环境中进行骨折检测,因为它的参数和计算复杂度较低。

数据处理和增强

文章中的实验流程如下图所示。由于GRAZPEDWRI-DX数据集的发布者没有提供预定义的训练集、验证集和测试集,研究者随机分配了70%作为训练集,20%作为验证集,10%作为测试集。

此外,由于低特征X射线图像的亮度多样性有限,仅在这些图像上训练的模型可能无法很好地泛化到其他环境中的X射线图像。为了增强模型的鲁棒性,研究者采用了数据增强技术来扩展训练集。具体来说,他们使用OpenCV库中的addWeighted函数对X射线图像的对比度和亮度进行了微调。

实验

数据集

本文使用GRAZPEDWRI-DX 数据集进行实验,这是一个由格拉茨医科大学提供的公共数据集,包含了20,327张儿童腕部创伤的X射线图像。这些图像由格拉茨大学医院的儿科放射科医生团队从2008年到2018年收集。数据集包括6,091名患者和10,643项研究,总共有74,459张标记图像,代表67,771个标记对象。数据集中存在显著的类别不平衡,其中“文本”和“骨折”类别的实例数量最多。

实验结果

研究比较了不同模型在GRAZPEDWRI-DX数据集上的性能,包括模型大小(参数和浮点运算次数)、准确性(F1分数、50%平均精度均值(mAP 50)和50%至95%平均精度均值(mAP 50-95))以及推理时间。

YOLOv9-C和YOLOv9-E的参数量(Params)和浮点运算次数(FLOPs)相对较高,这表明它们可能具有更复杂的网络结构,能够捕捉更多的特征信息。YOLOv9-C和YOLOv9-E的F1分数均为0.64,这是所有列出的模型中最高的,表明它们在精确度和召回率方面表现最佳。YOLOv9-C和YOLOv9-E的mAP 50分别为65.31%和65.46%,同样领先于其他模型,这意味着在50%的IoU阈值下,它们的目标检测精度最高。YOLOv9-C和YOLOv9-E的mAP 50-95分别为42.66%和43.32%,这显示了它们在不同IoU阈值下的整体性能优越,尤其是在更严格的检测标准下。YOLOv9-C的推理时间为5.2毫秒,而YOLOv9-E为6.4毫秒。虽然它们的推理时间比一些轻量级模型如YOLOv8略长,但考虑到它们在准确性上的显著提升,这种性能折中是可接受的。

实验中还进行了两个实验,输入图像大小分别为640和1024,实验结果如下图。

结果表明,YOLOv9-C(Compact)和YOLOv9-E(Extended)在保持合理推理速度的同时,显著提高了mAP。特别是,YOLOv9-E在mAP 50-95上达到了43.32%,比当前最佳模型YOLOv8+SA的41.49%高出了4.4%。当输入图像大小为1024时,YOLOv9-E的mAP 50-95达到了43.73%,也获得了最佳性能,但由于推理时间增加,它更适合部署在计算资源丰富的设备上。

论文分析了不同模型不同类别的PR曲线,如下图,从左到右依次为YOLOv8、YOLOv8+ResCBAM、YOLOv9。

YOLO系列模型的性能受到训练数据集的质量和多样性的显著影响。模型在预测“骨异常”和“软组织”类别时的准确性不足,是由于GRAZPEDWRI-DX数据集中相关数据不足所致。

复现

复现过程参见演示视频。

总结

论文首次将 YOLOv9 应用于医学图像识别领域,特别是在儿童腕部骨折检测这一细分领域,展示了 YOLOv9 在实时目标检测和医学图像识别中的优秀性能。通过在 GRAZPEDWRI-DX 数据集上的训练和测试,YOLOv9 模型在 mAP 50-95 指标上从当前最佳模型的 42.16% 提升至 43.73%,实现了 3.7% 的性能提升。

研究中采用了数据增强技术,通过调整 X 射线图像的对比度和亮度,增强了模型的泛化能力,使其能够更好地适应不同环境下的 X 射线图像。YOLOv9 模型的高精度和合理的推理时间使其适合作为计算机辅助诊断(CAD)系统,辅助放射科医生和外科医生在临床环境中分析 X 射线图像。

总的来说,这篇论文不仅在技术上推动了 YOLO 系列在医学图像分析领域的应用,而且为儿童腕部骨折的自动检测提供了一个有效的工具,有助于提高诊断的准确性和效率。

成功的路上没有捷径,只有不断的努力与坚持。如果你和我一样,坚信努力会带来回报,请关注我,点个赞,一起迎接更加美好的明天!你的支持是我继续前行的动力!"

"每一次创作都是一次学习的过程,文章中若有不足之处,还请大家多多包容。你的关注和点赞是对我最大的支持,也欢迎大家提出宝贵的意见和建议,让我不断进步。"

神秘泣男子