AnyDoor 是一款创新的AI工具,能够将任何对象(如人物、动物或物品)无缝集成到新的图像或视频场景中。这款扩散的图像生成器,借助先进的算法,实现了在用户指定的位置,以自然和谐的方式将目标对象“传送”到新的场景中,自动调整光线和角度以适应新环境。
由阿里巴巴与香港大学共同研发的这款AI技术,实现了无需样本训练的图像嵌入功能,极大地拓展了图像处理的边界。例如,在线购物时,消费者可以直接在模型上看到衣物的效果,提升购物体验。
「能不能把这张图里的产品,都放到另一张图的桌子上?」面对这样的要求,设计师肯定会脑瓜嗡嗡的。把指定物品放进另一张图片不像贴张贴纸一样简单,想要做到无缝接入,贴图的形状、材质、光影等等都需要在编辑软件里细致地调整。
如果有一种能让贴图穿进背景图里,它们根据你的指令自动摆好姿势、站位的「魔法」呢?
来自香港大学、阿里巴巴和蚂蚁集团的新成果 Anydoor 为图片编辑打开了一扇「任意门」。任何物品,只需要一张照片,就能被传送到另一张图片的世界中。
例如,想让这只柯基按照涂鸦的姿势,在墙角站卧坐躺,没有问题。
让哆啦 A 梦从背着手换成向你打招呼的姿势,分分钟搞定,还保留了原本的毛毡材质质感。
交换位置,移动物品,也是小 case。
不需要实物的多角度照片,也不需要 3D 建模,就可以看到这只鞋子的正面和侧面。
把野餐布上的另一只小熊换成这只鞋,再给它做个镜像效果,画个框,就可以静待魔法生成了。重新合成后,餐布的褶皱没有产生明显的形变。
试穿衣服也能玩成贴画游戏版本,给照片贴上想要的衣服,立体的上身效果立即可见。随着扩散模型的发展,图像编辑界卷出了不少新成果。此前的模型已经可以根据文本提示或给定图像重新生成局部的图像区域。但是这些方法对于不在训练数据内的新图象,泛化性较差,或者需要输入多个图像,在近一个小时后,才能等到生成结果。Anydoor 做到的是「对象传送」,这意味着将目标对象准确无缝地放置在场景图像的期望位置。具体来说,Anydoor 以目标对象为模板,重新生成场景图像被框中的局部区域,在图像合成、效果图像渲染、海报制作、虚拟试穿等应用场景都很实用。加班加点给大家肝出来了AnyDoor的懒人包,快随我去看看吧~
使用教程
- 下载压缩包
- 解压压缩包
注意:解压路径最好不包含中文。解压后,双击启动程序.bat
文件运行,如下图所示: - 等待加载完成
在浏览器中访问 http://0.0.0.0:7860/
,即可在浏览器中使用AnyDoor工具。
注意事项:
①该项需要英伟达显卡运行,建议10G显存以上
②请确保安装路径不包含中文,不然可能会引起奇怪的适配问题
thanks very much!!!!
相当实用啊
没有积分啊 难啊