现有图像修复技术通常很难为缺失区域生成视觉上连贯的内容,其原因是高频内容质量下降导致频谱结构的偏差,以及有限的感受野无法有效建模输入特征之间的非局部关系。为解决上述问题,提出一种融合双向感知Transformer与频率分析策略的图像修复网络(bidirect-aware Transformer and frequency analysis, BAT-Freq)。具体内容包括,设计了双向感知Transformer,用自注意力和n-gram的组合从更大的窗口捕获上下文信息,以全局视角聚合高级图像上下文;同时,提出了频率分析指导网络,利用频率分量来提高图像修复质量,并设计了混合域特征自适应对齐模块,有效地对齐并融合破损区域的混合域特征,提高了模型的细节重建能力。该网络实现空间域与频率域相结合的图像修复。在CelebA-HQ、Place2、Paris StreetView三个数据集上进行了大量的实验,结果表明,PSNR和SSIM分别平均提高了2.804 dB和8.13%,MAE和LPIPS分别平均降低了0.015 8和0.096 2。实验证明,该方法能够同时考虑语义结构的完善和纹理细节的增强,生成具有逼真感的修复结果。