
拖动您的 GAN:生成图像流形上的基于点的交互式操作
合成满足用户需求的视觉内容,往往需要对生成对象的姿势、形状、表情和布局进行灵活、精确的可控性。现有方法通过手动注释的训练数据或先前的 3D 模型获得生成对抗网络 (GAN) 的可控性,这些模型通常缺乏灵活性、精度和通用性。在这项工作中,我们研究了一种强大但鲜为人知的控制GAN的方法,即“拖动”图像的任何点,以用户交互的方式精确到达目标点,如图1所示。为了实现这一目标,我们提出了DragGAN,它由两个主要组件组成,包括:1)基于特征的运动监督,驱动手柄点向目标位置移动,以及2)一种新的点跟踪方法,该方法利用判别GAN特征来保持定位手柄点的位置。通过 DragGAN,任何人都可以通过精确控制像素的去向来变形图像,从而操纵动物、汽车、人类、风景等不同类别的姿势、形状、表情和布局。由于这些操作是在GAN的学习生成图像流形上执行的,因此即使对于具有挑战性的场景,例如幻觉遮挡的内容和始终遵循对象刚性的变形形状,它们也倾向于产生逼真的输出。定性和定量比较都证明了DragGAN在图像处理和点跟踪任务中优于以前的方法。我们还展示了通过GAN反转对真实图像的处理。
数据统计
数据评估
关于(DragGAN)特别声明
本站商娱网提供的DragGAN都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由商娱网实际控制,在2023-07-01 14:15收录和巡查时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,商娱网不承担任何责任。
相关导航

易媒助手是一款新自媒体矩阵系统,支持多账号管理,可以将图文、视频、动态一键分发上传至30+自媒体短视频平台,支持1000+账号管理、爆文采集、团队管理、批量上传、挂车、poi定位等50种特色功能。

DaVinci Resolve
DaVinci Resolve 颠覆传统的全新创意工具,集剪辑、调色、专业音频后期制作于一身的一站式流程!
旋风加速器
旋风加速器 不限流量,不限时间,真正免费的加速器,完美1080P,无论何时何地尽享隐私保护,网络自由。
Etherpad
Etherpad 是一个高度可定制的开源在线编辑器,提供实时的协作编辑。
Adobe软件2020版打包下载
Adobe软件2020版打包下载,如有需要请各位支持正版。
入梦AI变声器
入梦自己开发基于开源RVC制作的AI变声器,永久免费给大家分享使用,数十种中精选音源一键切换,包集成入梦虚拟声卡,AI降噪等,入梦工具箱等辅助工具,使用简单,切换方便

微信一键取消关注公众号软件工具
一键取消所有公众号,比较适合一些关注了一些乱七八糟的公众号,又不想一个个取消的。
求字体网
求字体网提供上传图片找字体、字体实时预览、字体下载、字体版权检测、字体补齐等服务,本网站可识别中文、英文、日韩、书法等多种字体。只要上传图片或输入字体名称,就可以帮您找字体。
暂无评论...

