AI科研灵感致力于成为您在人工智能领域的领航者,定期更新人工智能领域的重大新闻与最新动态,和您一起探索AI的无限可能。

2025深度学习发论文&模型涨点之——边界注意力

边界注意力是一种边界感知局部注意力操作,当密集且重复地应用时,它会逐步细化变量字段,这些变量指定图像中每个重叠补丁中局部边界结构的非光栅化描述。它是一种可微分模型,通过一种称为边界注意力的机制来明确地建模边界,包括轮廓、角点和交叉点。

          • 目标检测:边界注意力模型能够推断图像中的几何原语,如边缘、角、交叉点和均匀外观区域,其输出可用于目标检测。

          • 图像分割:该模型在任何分辨率下都能找到微弱的边界,能够处理低分辨率图像中的信息丢失问题,使计算机视觉系统能够更好地理解图像中的几何结构和特征。

          • 图像修复:通过边界注意力机制,模型可以更准确地捕捉和理解图像中的关键特征,为图像修复任务提供新的思路和方法。

          小编整理了一些边界注意力论文】合集,以下放出部分,全部论文PDF版皆可领取。

          需要的同学扫码添加我

          回复“边界注意力”即可全部领取

          图片

          论文精选

          论文1:

          MEGANet Multi-Scale Edge-Guided Attention Network for Weak Boundary Polyp Segmentation

          MEGANet:用于弱边界息肉分割的多尺度边缘引导注意力网络

          方法

            • 编码器-解码器网络结构:采用U-Net架构的编码器用于捕获输入图像的视觉表示,解码器用于提取显著特征。

              边缘引导注意力模块(EGA):利用拉普拉斯算子保留高频信息,特别是边缘细节,通过编码视觉特征、解码预测特征和高频特征的组合来增强模型对边缘的关注。

              拉普拉斯金字塔:用于提取和保留图像的高频细节,为EGA模块提供高频率特征。

              二元交叉熵损失和骰子损失:作为网络训练的目标函数,结合使用以提高分割性能。

              图片

            创新点

                      • 边缘引导注意力模块(EGA):通过结合经典边缘检测技术和注意力机制,有效保留边缘和边界信息,解决神经网络深层边缘信息侵蚀问题。

                        多尺度处理:在多个尺度上运行EGA模块,确保在不同尺度下都能保持边缘细节,提升模型对息肉边界的整体捕捉能力。

                        性能提升:在五个基准数据集上进行的大量实验证明,MEGANet在六个评估指标下均优于其他现有方法,例如在Kvasir数据集上,MEGANet(ResNet-34)的mDice得分为91.1,高于其他方法。

                        图片

                      论文2:

                      Region-Aware Text-to-Image Generation via Hard Binding and Soft Refinement

                      RAG:通过硬绑定和软优化实现区域感知的文本到图像生成

                      方法

                          • 区域硬绑定:在去噪过程的早期阶段,将输入提示分解为多个区域的基本描述,并分别进行去噪处理,确保每个区域的基本描述得到准确执行。

                            区域软优化:在去噪过程的后期阶段,为每个区域生成高度描述性的子提示,并通过交叉注意力层实现区域局部条件与全局图像潜在表示的交互。

                            扩散模型:基于Diffusion Transformer(DiT)的模型,整合了Transformer作为骨干网络,能够高效捕捉数据中的复杂依赖关系。

                            注意力机制:在去噪过程中,通过计算查询矩阵、键矩阵和值矩阵的注意力权重,逐步捕获潜在空间中的特征表示。

                            图片

                          创新点

                                  • 区域硬绑定和软优化:通过将生成过程分解为区域构建和细节优化两个子任务,实现了对复杂多区域生成任务的精确控制。

                                    图像重绘功能:支持用户修改之前生成图像中的特定不满意区域,同时保持其他区域不变,无需依赖额外的图像修复模型。

                                    性能提升:在T2ICompBench基准上的对齐评估显示,RAG在属性绑定、对象关系和复杂组合方面优于其他方法,例如在处理具有空间关系的提示时,RAG的准确率比RPG高出29%。

                                    图片


                                  论文3:

                                  Progressive Classifier and Feature Extractor Adaptation for Unsupervised Domain Adaptation on Point Clouds

                                  点云的无监督域适应中的渐进式分类器和特征提取器适应

                                  方法

                                  • 渐进目标风格特征增强(PTFA):通过构建一系列中间域,使模型逐步适应目标域,同时逐步调整源域和目标域样本的选择比例。

                                    中间域特征提取器适应(IDFA):通过紧凑的特征对齐,鼓励特征提取器提取目标风格的特征,减少域间差异。

                                    渐进目标接近策略(PTA):在训练过程中逐步减少源域样本的选择数量,增加目标域样本的选择数量,以平滑地过渡到目标域。

                                    特征增强:在源特征上构建目标风格的特征增强,以增强分类器对目标域的适应能力。

                                    图片

                                  创新点

                                          • PTFA策略:通过逐步构建中间域,使模型能够更平滑地适应目标域,避免了直接跨越大域间差距带来的问题。

                                            性能提升:在PointDA-10和GraspNetPC-10数据集上,该方法平均准确率分别比之前的最佳方法提高了2.9%和3.1%,显著优于其他无监督域适应方法。

                                            IDFA策略:通过紧凑的特征对齐,提高了特征提取器对目标域的适应能力,增强了模型的泛化性能。

                                            样本选择策略:通过逐步调整源域和目标域样本的选择比例,提高了模型对目标域的适应能力,特别是在源域样本噪声较大的情况下。

                                          图片


                                          论文4:

                                          SAM-Assisted Remote Sensing Imagery Semantic Segmentation with Object and Boundary Constraints

                                          SAM辅助的遥感影像语义分割:具有对象和边界约束

                                          方法

                                            • SAM预处理:利用SAM生成SAM生成的对象(SGO)和SAM生成的边界(SGB),作为语义分割任务的辅助信息。

                                              对象一致性损失:通过约束对象内像素的一致性,利用SGO中的对象信息,增强语义分割模型对对象内部一致性的关注。

                                              边界保持损失:基于SGB中的边界信息,引导模型在分割过程中更好地关注对象边界,提升边界分割的准确性。

                                              编码器-解码器网络:采用如UNetformer等经典的编码器-解码器结构作为语义分割模型,直接利用SAM生成的SGO和SGB进行损失计算,无需额外的分割头。

                                              图片

                                            创新点

                                                • SGO和SGB的利用:通过简单有效的框架充分利用SAM的原始输出,无需对语义分割模型、训练策略或伪标签生成进行特定设计。

                                                  对象一致性损失和边界保持损失:这两个损失函数直接利用SAM生成的对象和边界信息,无需语义信息,从对象和边界两个关键角度提升分割结果的质量。

                                                  性能提升:在ISPRS Vaihingen和LoveDA Urban两个数据集上的实验结果表明,该方法在不同数据集和不同通用模型上均具有良好的适应性和提升效果,例如在ISPRS Vaihingen数据集上,UNetformer+SAM的mF1和mIoU分别比UNetformer提高了0.55%和0.91%。

                                                  图片

                                                小编整理了边界注意力文代码合集

                                                需要的同学扫码添加我

                                                回复“ 边界注意力”即可全部领取

                                                图片

                                                Logo

                                                一站式 AI 云服务平台

                                                更多推荐