AnatoMask的分层图像编码器-解码器-方法思想

在这里插入图片描述

采用多尺度编码器-解码器主干：

输入D（深度Depth）张H（高Height）*W（宽Width）的CT图像

想象一下，我们有一张大的CT图像，我们把它切成了很多小块，每一块的大小是16×16×16（这里的H、W、D分别代表高度、宽度和深度）。这些小块就是我们说的“输入patch”。

然后，我们用一个叫做STU-Net的工具来处理这些被遮盖的小块。这个工具会把这些小块变得更小，变成四个不同的尺寸：H2 × W2 × D2，H4 × W4 × D4，H8 × W8 × D8，和H16 × W16 × D16。这就像是把一张纸片折叠起来，每次折叠都变得更小。

最后，我们比较遮盖前后的图像，看看模型恢复得怎么样。我们计算一个叫做“重构损失”的东西，它告诉我们模型恢复的图像和原来的图像之间有多大的差异。如果重构损失很小，说明模型做得很好，能够从遮盖的部分推测出被遮盖的信息。

在整个过程中，我们的目标是训练一个模型，让它即使在部分信息被遮盖的情况下，也能理解和恢复整个图像的内容。这就像是一个拼图游戏，即使一些拼图片被拿走了，模型也需要能够猜出这些拼图片原来的位置和样子。

秒客网