CycleGAN发明人新作：AI实现艺术Cinemagraph，绝妙的“静图之上，视频未满”效果！... - 代码天地

CycleGAN发明人新作：AI实现艺术Cinemagraph，绝妙的“静图之上，视频未满”效果！...

企业开发 2023-08-26 21:10:34 阅读次数: 0

文章来源新智元编辑：桃子

【导读】百度百科：“Cinemagraph，静态照片中神奇的细微运动技术。顾名思义（cinema是电影摄影，graph是图片）是动态摄影和静态图片的结合，这项艺术最早就是从cinemagraphs 这个网站流出，来自NYC的Jamie 和Kevin两个艺术家。”

最新AI模型Text2Cinemagraph，只需短短一行字，就可以让艺术大师的作品动起来。

CV大佬朱俊彦的新论文，让动画师感觉危了。

只需要一句话，模型就能将其生成一个风格一致，画质细腻的动画。

以梵高星之夜为参考，创作一个山前小溪流过的画面。

又或以阿夫列莫夫的风格，创作一个瀑布从山间飞跃而下的景观。

近日，来自CMU和Snap机构的研究人员，构建了一个根据文本描述创建电影画面的全自动方法——Text2Cinemagraph。

论文地址：https://arxiv.org/pdf/2307.03190.pdf

另外，研究人员展示了2个扩展功能，为现有绘画制作动画，以及使用文本控制运动方向。

不如，我们先看一波演示吧。

演示来袭

上面梵高星之夜的小溪流向，动动嘴就能控制。

比如，从左到右。

再从右到左。

同样风格下的，不同景观。

‍电影画质的，海上帆船。

日落时，梵高绘画风格的，山丘之间落下的大瀑布，4K。

毕加索风格，一座小木屋，有一艘船漂浮在湖上。

超逼真的插图，灯塔被海怪袭击，触手包裹整个塔楼。

超现实和梦幻般的瀑布场景

Text2Cinemagraph项目

当前，现有的单图像动画方法，在艺术输入方面存在不足。

而最新的基于文本的视频方法经常会引入时间上的不一致性，难以保持某些区域的静态。

为了应对这些挑战，研究人员提出了从单个文本提示，合成孪生图像（image twin）的想法，即一对艺术图像及其像素对齐。

艺术图像描绘了文本提示中详细描述的风格和外观，而现实图像则大大简化了布局和运动分析。

利用现有的自然图像和视频数据集，Text2Cinemagraph可以准确地分割现实图像，并根据语义信息预测合理的运动。

然后，预测的运动可以转移到艺术图像中，以创建最终的电影动画。

具体来讲，给定一个文本提示 c，用Stable Diffusion生成孪生图像，一个艺术图像x在文本提示中描述的样式中，和一个现实的对应物使用修改后的提示。孪生图像有相似的语义布局。

然后，研究人员从艺术图像生成过程中，获得的自注意力映射中提取运动区域的二进制掩码M。

使用掩码和逼真的图像，来预测光流与流预测模型.

由于孪生图像有非常相似的语义布局，可以使用光流与视频生成器让艺术图像动起来。

值得一提的是，这项研究的所有实验都基于Stable Diffusion。

研究者比较了真实的光流效果。

与SLR-SFS、Holynski等人的研究单图像动画方法相比，Text2Cinemagraph所有帧平均的真实光流。

总体而言，最新方法能预测出更合理的运动，与目标区域更吻合。

另外，通过用户偏好调查显示，大多数参与者都赞成Text2Cinemagraph。

最后，研究人员还演示了两个扩展功能：为现有绘画制作动画和使用文本控制运动方向。

为现有绘画制作动画

如下是在俄罗斯博物馆展出的The Ninth Wave (1850)。

由Albert Bierstadt创作的布面油画Minnehaha Falls。

作者介绍

Jun-Yan Zhu（朱俊彦）

朱俊彦现任CMU计算机学院机器人研究所的助理教授，是计算机图形学领域现代机器学习应用的开拓者。

在加入CMU之前，他曾是Adobe Research的研究科学家。

他曾在MIT CSAIL做博士后，与William T. Freeman、Josh Tenenbaum和Antonio Torralba一起工作。

他还在加州大学伯克利分校获得博士学位，在Alexei A.Efros的指导下。并在清华大学获得学士学位，与Zhuowen Tu，Shi-Min Hu和Eric Chang一起工作。

参考资料：

https://text2cinemagraph.github.io/website/

关注公众号【机器学习与AI生成创作】，更多精彩等你来读

卧剿，6万字！30个方向130篇！CVPR 2023 最全 AIGC 论文！一口气读完

深入浅出stable diffusion：AI作画技术背后的潜在扩散模型论文解读

深入浅出ControlNet，一种可控生成的AIGC绘画生成算法！

经典GAN不得不读：StyleGAN

戳我，查看GAN的系列专辑~！

一杯奶茶，成为AIGC+CV视觉的前沿弄潮儿！

最新最全100篇汇总！生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

ICCV 2021 | 35个主题GAN论文汇总

超110篇！CVPR 2021最全GAN论文梳理

超100篇！CVPR 2020最全GAN论文梳理

拆解组新的GAN：解耦表征MixNMatch

StarGAN第2版：多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云：独学而无友，则孤陋而寡闻

点击一杯奶茶，成为AIGC+CV视觉的前沿弄潮儿！，加入 AI生成创作与计算机视觉 知识星球！

猜你喜欢

转载自blog.csdn.net/lgzlgz3102/article/details/132439976

CycleGAN发明人新作：AI实现艺术Cinemagraph，绝妙的“静图之上，视频未满”效果！...

OCR的发明人是谁？

A* 算法发明人 Nils Nilsson 逝世

英国最高法院：专利发明人必须是自然人，不能是 AI

复制粘贴发明人和Java 语言发明人相继去世

PHP发明人谈MVC和网站设计架构

采访 Lua 发明人的一篇文章

Tcl 和 Raft 发明人的软件设计哲学

验证码发明人的天才故事

由日本发明人造肝脏看中国的医学界

算术公理化的发明人—格拉斯曼

互联网已诞生30年发明人称迎来“问题青春期”

Donchian Channel(唐奇安通道)及其发明人Richard Donchian的前世今生

CCI（Commodity Channel Index顺势指标）指标及其发明人Donald Lambert的前世今生

MTM（Momentum）动量指标及其发明人J. Welles Wilder的前世今生

【创业的故事】在深圳一个发明人遇到困难给中央的书言

复制粘贴发明人、Java 和互联网创建者相继去世

量化指标ATR(Average True Range真实波动幅度均值)及其发明人Welles Wilder的前世今生

“复制粘贴”发明人，竟是物理学博士转行做程序媛！

复制粘贴发明人、Java 和互联网创建者相继去世，向初代互联网大佬致敬！

复制粘贴发明人、Java 和互联网创建者相继去世，向初代互联网大佬致敬

【历史上的今天】1 月 5 日：正则表达式的发明人出生；英特尔发布酷睿系列；Microsoft Bob 诞生

【历史上的今天】7 月 6 日：RSA 算法发明人诞生；AR 游戏 Pokémon GO 发布；Tumblr 创始人出生

现代数据中心发明人Luiz André Barroso去世，享年59岁，Jeff Dean、劈柴发推悼念

AI CycleGAN

专利发明人是子公司的员工，专利申请人是母公司名称，在职称评审时这个专利对子公司员工算不算成果

万维网WWW发明人图灵奖得主TimBerners-Lee蒂姆·伯纳·李爵士简历(公号回复“TimBL蒂姆·伯纳·李”下载PDF) 原创：秦陇纪数据简化DataSimp 今天数据简化DataS

Qt实现艺术字效果

AI 绘画 | Stable Diffusion 艺术字与光影效果

CycleGan实现图像转换

今日推荐

周排行

vue + echart +map中国地图，省市地图，区县地图

spring boot2 (31)-cors跨域请求

『学习资料推荐』299元买的微信营销资料打包

个人学习卷积神经网络的疑惑解答

网络工程师-软考

模拟人生4 春夏秋冬、星梦起飞版更新下载方法以及常见问题

python关于对象的字符串显示str和repr以及

奇怪的session混乱问题

【3】分治法（divide-and-conquer）

Java项目开发成绩管理系统（九）各模块实现信息修改

每日归档

更多

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)