“视频版ControlNet”来了!
让蓝衣战神秒变迪士尼公举:
【资料图】
视频处理前后,除了画风以外,其他都不更改。
女孩说话的口型都保持一致。
正在插剑的姜文,也能“下一秒”变猩球崛起了。
这就是由全华人团队打造的最新视频处理算法CoDeF,发布才几天,迅速在网上爆火。
网友们看了直呼:
这一天天的,虚实分辨越来越难了!
只需要自己拍点东西,然后覆盖上去,就能变成各种各样的动画了。
有人说,只需给它一年时间,就能被用在电影制作上了。
这马上引来其他人的肯定:技术发展真的非常疯狂、非常快。
目前,团队已将这一方法在GitHub上开源。
姿势不变,画风“皮套”随便换
之所以会被称为是“视频版ControlNet”,主要原因在于CoDeF能够对原视频做到精准控制。
(ControlNet实现了根据提示词精准控制图像元素改变,如人物动作、图像结构等)
根据给到的提示词,它仅改变视频的画风,而且是针对完整视频。
比如输入“Chinese ink painting”,风景纪录片能秒变国风水墨大作。
包括水流也能很好跟踪,整个流体动向都没有被改变。
甚至一大片穗子,在原视频里怎么摆动,改变画风后频率和幅度也如出一辙。
在画风改变上,CoDeF也做了很多细节处理,让效果更加逼真合理。
“由春入冬”后,原本有涟漪的河流静止了,天空中的云彩被换成了太阳,更加符合冬日景象。
霉霉变成魔法少女后,耳环被换成了发光宝石,手里的苹果也换成了魔法球。
这样一来,让电影角色一键变老也简单了许多。
皱纹可以“悄无声息”上脸,其他一切都没有变化。
所以,CoDeF是怎么实现的呢?
可跟踪水和烟雾,跨帧一致性更强
CoDeF是英文“the content deformation field”的缩写,即作者在此提出了一种叫做内容形变场的新方法,来用于视频风格迁移任务。
比起静态的图像风格迁移,这种任务的复杂点在于时间序列上的一致性和流畅度。
比如处理水、烟雾这种元素,两帧画面之间的一致性非常重要。
在此,作者“灵机一动”,提出用图片算法来直接解决视频任务。
他们只在一张图像上部署算法,再将图像-图像的转换,提升为视频-视频的转换,将关键点检测提升为关键点跟踪,而且不需要任何训练。
这样一来,相较于传统方法,能够实现更好的跨帧一致性,甚至跟踪非刚性物体。
具体而言,CoDeF将输入视频分解为2D内容规范场(canonical content field)和3D时间形变场(temporal deformation field):
前者用于聚合整个视频中的静态内容;后者则负责记录图像沿时间轴的每个单独帧的转换过程。
利用MLP(多层感知器),每个场都用多分辨率2D或3D哈希表来表示。
在此,作者特意引入了正则化,来保证内容规范场能够继承原视频中的语义信息(比如物体的形状)。
如上图所示,这一系列设计使得CoDeF可以自动支持各种图像算法直接应用于视频处理——
也就是只需利用相应算法提取出来一张规范图像,然后通过时间形变场沿着时间轴传播结果即可。
比如,给CoDeF“套上”本用于图片处理的ControlNet,就可以完成视频风格的“翻译”(也就是我们开头和第一段看的那一堆效果):
“套上”分割一切算法SAM,我们就能轻松做到视频的对象跟踪,完成动态的分割任务:
“套上”Real-ESRGAN,则给视频做超分也是信手拈来……
整个过程非常轻松,不需要对待操作视频进行任何调整或处理。
不仅能处理,还能保证效果,即良好的时间一致性和合成质量。
如下图所示,相比去年诞生的Layered neural atlas算法,CoDeF能够呈现非常忠于原视频的细节,既没有变形也无破坏。
而在根据文本提示修改视频风格的任务对比中,CoDeF全部表现突出,不仅最匹配所给要求,也有着更高的完成度。
跨帧一致性则如下图所示:
一位一作刚本科毕业
这项研究由香港科技大学、蚂蚁团队、浙江大学CAD&CG实验室共同带来。
共同一作有三位,分别是欧阳豪、Yujun Shen和Yuxi Xiao。
其中欧阳豪为港科大博士,师从陈启峰(本文通讯作者之一);本科导师为贾佳亚。曾在MSRA、商汤、腾讯优图实验室实习过,现在正在谷歌实习。
另一位是QiuyuWang。Yujun Shen是通讯作者之一。
他是蚂蚁研究所的高级研究科学家,主管交互智能实验室,研究方向为计算机视觉和深度学习,尤其对生成模型和3D视觉效果感兴趣。
第三位一作为Yuxi Xiao才刚刚从武大本科毕业,今年9月开始在浙大CAD&CG实验室读博。
他以一作身份发表的论文Level-S2fM: Structure from Motion on Neural Level Set of Implicit Surfaces,被CVPR2023接收。
关键词:
凡注有"环球传媒网 - 环球资讯网 - 环球生活门户"或电头为"环球传媒网 - 环球资讯网 - 环球生活门户"的稿件,均为环球传媒网 - 环球资讯网 - 环球生活门户独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"环球传媒网 - 环球资讯网 - 环球生活门户",并保留"环球传媒网 - 环球资讯网 - 环球生活门户"的电头。
- 爆火“视频版ControlNet”开源了:靠提示词2023-08-21
- 美东汽车(01268)发盈警 预计中期股东应占2023-08-21
- 午休时间短、供餐场所少 写字楼里的上班族2023-08-21
- “830新规”出台近两年 未成年人“防沉迷2023-08-21
- 沙漠越野、徒步穿越等受追捧 享受野趣请不2023-08-21
- 7月运输生产总体保持恢复发展态势2023-08-21
- 湖北省纪委监委通报5起省属国有企业“靠企2023-08-21
- 北京时间8月21日,乒乓球传来钱天一、王楚2023-08-21
- qq随心贴语录(QQ随心贴语录推荐)2023-08-21
- 拜登曾寄予厚望!这一巨头,申请破产保护!2023-08-21
- 上会前夜被叫停,全面注册制下首例主板IPO2023-08-21
- 协会商会可扮演更重要角色2023-08-21
- 产业升级推动“新三样”走俏2023-08-21
- 治理网络谣言平台需积极履责2023-08-21
- 全国首份外卖平台企业集体合同落地——为劳2023-08-21
- 北上消费火爆的逻辑2023-08-21
- 科技助力考古,勾勒生动历史细节2023-08-21
- 王富仁:在文学研究与语文教育之间2023-08-21
- 复工复产陆续按下“启动键”——河北涿州受2023-08-21
- 2023年长江源冰冻圈水文与生态环境综合科学2023-08-21
- 万达收购盈方这八年 从大手笔入局、退市到2023-08-21
- 西班牙女足复制男足奇迹,技术流足球称雄,2023-08-21
- 喵可莉的兔玩偶dlc后续同人文:未剪断的恨2023-08-21
- 长安cs35原装轮胎什么牌子(长安cs35的原车2023-08-21
- 阿斯顿·马丁推出令人惊叹的全新超级跑车2023-08-21
- 驱动精灵2009正式版 驱动精灵最新版本)2023-08-21
- 神格神经_神格2023-08-21
- 高二生物教学工作总结个人2023(高二生物教2023-08-20
- 愈演愈烈! 浙江广电回应《中国好声音》事2023-08-20
- 路……2023-08-20
- 河南省农业农村厅秋粮生产第十五专家指导组到西平县调研指导 每日聚焦
- 天天资讯:确山县朗陵街道:防溺水 巾帼行
- 热头条丨淮滨县不动产登记中心党支部:常态化开展饺子宴活动
- 世界热头条丨驻马店市驿城区朱古洞乡:让群众喝上“放心水” 为乡村振兴提供“水动能”
- 驻马店市生态环境局新蔡分局组织开展“悟思想”学纪守纪交流活动
- 泌阳县泌阳河“美丽河湖”建设成效显著 全球即时看
- 世界观热点:邓州市法院开展“送法进军营”活动
- 世界观天下!汝南县“爱心粥”志愿服务项目荣获河南省项目大赛二等奖
- 西平县柏苑街道开展2023年纪律教育宣传月“明纪律,铸忠诚”集体学习
- 世界热门:息县县委书记、县政府县长管保臣调研城区项目建设情况
资讯
焦点
- 环球速读:桐柏法院:一看要动真格 被执行人忙还钱
- 西平县师灵镇扎实做好第五次全国经济普查前期准备工作|世界观热点
- 汝南县市场监管局:打造“智慧市监” 优化营商环境
- 内乡法院:工伤认定存争议 行政和解“一案多赢”化矛盾
- 当前简讯:以赛促练 比学赶超——西平县妇幼保健院举办高质量心肺复苏技能竞赛
- 汝南县东官庄镇:交流研讨促提升 提质增效促发展|世界速讯
- 聚焦:驻马店市驿城区老街街道:筑牢食安防线 守护居民“舌尖上的安全”
- 西平县文广旅局召开校外艺术培训机构规范化管理工作会
- 西平县应急管理局开展防养老诈骗宣传活动_环球观天下
- 资讯推荐:西平县应急管理局组织开展2023年自救互救及应急救护知识与技能培训进社区活动