U-Net 结构示意图,它直观展示了:
左侧是编码器(Encoder):通过 conv 3×3 + ReLU 和 max pool 2×2 不断减小特征图尺寸(从 256×256 到 16×16),同时增加通道数(从 16 到 256)。
右侧是解码器(Decoder):通过 bilinear upsampling 恢复尺寸,并与编码器对应层的特征图 copy and concat 融合,最后通过 conv 1×1 输出。
整体呈 “U” 形,所以叫 U-Net,常用于医学图像分割等密集预测任务。