人工智能技术在以较快的速度不断发展,图像修复早已是电脑视觉方面的一项核心任务。在当今这个信息时代,全球经济获得了快速的发展并且科技得到了深层面的发展,人们对数字图像进行获取和存储等操作的时候都会更加简单。人们通过数字图像这一关键媒介实施相关数据的获取、贮存、传送等一系列操作时,很多因素会造成数字图像受损以及数据丢失的情况。为确保数字图像在视觉方面比较优良并且确保其涵盖的数据比较完整,那么要求对受损的数字图像实施相应的修复处理。
图像修复是恢复损坏图像中缺失或损坏区域的任务,它在图像编辑,遮挡去除和旧照片还原中具有许多应用,例如:影视制作、成像设备开发、医疗诊断等。
近年来,各类深度学习模型不断被提出,深度学习在人工智能领域的研究也取得了前所未有的突破性进展。生成式对抗网络GAN也成为深度学习领域一个新的研究热点,一经提出就受到了学术界和工业界的重视。同时GAN的相关理论与实践也在迅速发展,它在图像修复方面也是大放光彩,可以对图像缺失的部分进行修复。
什么是生成式对抗网络?
年,Goodfellow等人提出了生成对抗网络(GenerativeAdversarialNetworks,GAN)。GAN的结构由生成器和判别器组成,是在一个复杂分布上无监督学习的分类器,虽然GAN拥有比较清晰和完善的逻辑架构,但是在一开始GAN对多层分类任务的识别准确度并不高,此后研究人员的研究重点一直在提高GAN的准确度,目前通过研究人员的不断努力GAN已经到达了一个比较高的完成度,GAN已经是二分类任务中最有潜力的方法。
GAN由两大核心部分组成,分别为生成模型和判别模型,生成模型在不断读取数据源中的特征数据,同时不断学习数据源中的特征信息,然后生成伪样本,伪样本的功能是混淆判别模型。而判别模型通过学习真实样本和伪样本的差异,分析出规律。生成模型和判别模型不断交流的过程就是数据不断生成和对抗的过程。GAN的优势在于训练样本不足的情况下,仍然能有效分辨出原有数据的分布规律。GAN的判别率很大程度上依赖样本集的数量和质量,其中样本集的数量尤其重要,数据量很大的样本集即使质量不是很高,GAN也可以慢慢自我学习强化,达到训练的目的,数量的优势可以大大弥补样本集质量的不足。一般普遍认为在处理图像分类任务的时候使用GAN相比于其他分类器并没有展现出很大的优势,但是在图像生成、图像优化方面GAN时相比于其他分类器具有独一无二的价值。
GAN如何实现图像修复?
先训练1个生成模型学习到真实图像的概率分布,另外经过改良后的GAN中的对抗学习这种样式去改良生成模型的学习效果。经过训练以后的生成模型依据等候修复的图像形成和其接近的完整图像,接着从获取图像中的对应切片实施相应的补全,然后将其输入判别器进行判别,从而确保等候修复的图像中缺失的内容得到最佳的修复。GAN模型主要由两部分组成其一,图像生成网络G(Generator),它经过导入组随机性的噪声K以最大限度形成逼真度比较高的样品;第二部分是判别网络,其能够经过对生成网络产生的图像X进行判别并更新判别网络参数,以加强对网络的判别能力。生成器G、判别器D经过持续对抗训练,由此对对抗损失函数实施相应的优化。GAN的目标函数是关于D与G的一个零和游戏,也是一个最小和最大化问题。先是从暗藏的空间获取d维噪声向量并且能够反馈至相关的G网络中。G能够把此向量转化成图像并且传送至D网络中实施相应的分类操作。D网络能够持续从实际数据集与经过G网络获取图像从而获得新的图像。它重点对真、假图像进行区分,所有的GAN构架遵循的设计规则是相同的,如图1所示。
图1GAN的模型图
以下展示了使用生成式对抗网络修复图片的效果图
GAN在计算机视觉领域中的其他应用
(1)图像超分辨率重建
实际生活中,人们经常会遇到一些分辨率低,难以辨认的模糊图像。将模糊图像分辨率提高使图像清晰化的过程就是超分辨率重建。超分辨率问题主要表现在放大因子较高的情况下,超分辨率图像因为纹理细节的丢失而无法辨认。SRGAN32是第一个可以将自然图像放大四倍以获得超分辨率的框架。它将感知损失和对抗损失加权相结合,用来提髙超分辨率图像的真实感,给人良好的视觉感受。实验结果如图2所示,低分辨率图像基于SRGAN生成的图像细节更加明显,清晰度也有所提升。
图2基于SRGAN生成图像示例
(2)文本生成图片
根据输入的文本生成相应图像技术是在GAN应用方面的一个创新,这比单纯的生成图像难度更大,复杂度更高。因为这涉及了对自然语言的处理以及对文本的语义理解Scottreed提出的深层卷积结构GAN框架,在文本和图像之间搭建了桥梁,首先将文本进行编码,经过全连接层后与随机向量进行拼接,之后输入到生成网络中生成图片,判别网络需对生成图片的真伪进行判别。本生成图像的一些实验生成结果如图3所示。
图3文本生成图片示例
(3)虚拟换衣
虚拟换衣,即给定某款衣服图像,让目标试衣者虚拟穿上。服装转移问题包括两个任务:学习如何将一个人的身体(姿势,身材,肤色)与他们的衣服(服装类型,形状,样式)分开,生成新的穿着任意服装的同一个人。Raffiee等人提出GarmentGAN:仅需要两个输入图像,即要穿的时装图像和穿衣人图像;输出是合成图像。为了使生成的图像逼真,采用新颖的方法生成对抗技术。论文中提出的算法在训练过程中结合分割信息和人体关键点信息。与现有方法比,采用生成对抗技术改进了生成图像真实性并解决了与遮挡有关的一些问题。可以看出GAN在虚拟换衣中也有很大的作用。实验结果如图4所示。
图4虚拟换衣实验结果示例
参考文献
[1]LinXianming,LiJie,ZengHualin,etal.Fontgenerationbasedonleastsquaresconditionalgenerativeadversarialnets[J].MultimediaToolsApplications,,78(7):1-15.
[2]ZengY,FuJ,ChaoH,etal.Learningpyramid-contexten-codernetworkforhigh-qualityimageinpainting[A].ConferenceonComputerVisionandPatternRecognition[C].USA:IEEE,.-.
[3]ShanCao,GaoyunAn,ZhenxingZheng,etal.InteractionsGuidedGenerativeAdversarialNetworkforunsupervisedimagecaptioning.,:-.
文章作者:数字经济研究院张赛赛李伟廖列法来源:智慧章贡综合数字经济研究院
编辑:李月
校对:钟情、四月
编审:肖荣
终审:王凡华
▼推荐阅读▼
天冷了,记得加衣服哦!戳在看的变好看↓↓↓转发扩散!!预览时标签不可点收录于合集#个上一篇下一篇