基于深度学习的显著性目标检测方法又可以分为两类,第一类模型使用多层感知机(MLPs)来进行显著性目标检测,第二类模型则使用完全卷积神经网络(FCN)来进行显著性目标检测。 在第一类模型中,输入图像通常被过度成单个或多尺度的小区域,然后将CNN用于提取图像中的高级特征,该高级特征随后被反馈回MLP以确定每个小区域的显着性值。 与完全卷积神经网络方法不同的是,第一类模型虽然使用CNN提取高级特征,但由于MLP的使用,CNN所提取的特征中的空间信息并不能被保留。 而第二类基于完全卷积神经网络(FCN-based)的模型则首先在 [9]中被开创性地提出,被用于解决语义分割问题。 由于显着对象检测本质上是一种分割任务,因此许多研究人员采用基于FCN的体系结构,因为它们具有保存空间信息的能力。