“你是否有想过P图只需要拖动鼠标,比如你想让一个双唇紧闭,眉头紧蹙的美女微笑,只需要网上拖动下嘴唇,图片中美女立马就变得喜笑颜开。还别说,真有人干出了这件事情,前段时间被吹爆的DragGAN放出了官方效果图,下面就带领各位一起领略一下。”
01
—
DragGAN简介
顾名思义,通过DragGAN,我们可以任意拖动图像进行编辑,无论是对象的形状、布局、姿态、表情、位置、大小,都可以做到精准控制。
在确定关键点的起始和终止位置之后,再根据对象的物理结构,用GAN生成符合逻辑的图像,一张挑不出破绽的图就做好了。
模特的姿势可以随意改变,短裤可以变成九分裤,短袖可以变长袖。
看上去效果不错,实际操作起来的效果会差强人意还是完美复制呢,在6.25号晚上,作者也悄然发布了源码,既然开源,我们没有理由不去实际跑跑看效果。XingangPan/DragGAN: Official Code for DragGAN (SIGGRAPH 2023) (github.com)
02
—
源码实操
直接clone下来代码,源码有conda的yaml文件,但是没有requirments.txt文件,但是根据作者的提示,需要根据styleGAN3的环境来进行配置,那自然少不了
pip install torch torchvision Ninja gradio huggingface_hub hf_transfer
然后根据提示下载模型sh scripts/download_model.sh,然后启动
python visualizer_drag_gradio.py
遗憾的是,windows下环境配置实在是太拉了,只能借助其他大神的gui来先看看效果,遗憾的是不能用自己的图片。
作者文章最后说是代码大部分借鉴了StyleGAN3以及StyleGAN-human
所有后续我们就继续玩一玩styleGAN3,应该也能实现类似的效果
整体来说,DragGAN的主要实现还是基于styleGAN,想法很新颖,所以你说酷还是不酷。
喜欢的朋友点个关注点个赞