A Self-supervised Approach for Adversarial Robustness(CVPR 2020)

image-20240423095955449

攻击部分

image-20240423100023925

  • n是模型的第n层输出特征

防御部分

image-20240423100035201

  • 这里$C_\Phi$输出应该是一个值可能为错误图像的概率,这样随着$P_\theta$将对抗图像优化的越来越像真图,差值减小,loss下降。