阅读: 2024/1/30 16:49:19
来自中国科学院大学、中国科学院、字节跳动和清华大学的研究团队基于扩散模型建立了协调多模态输入和在艺术图像生成领域执行多任务的统一框架—— CreativeSynth。它可以通过反转和实时风格转换,将现实世界语义内容导入艺术领域,在保持原始模型参数完整性的同时,对图像风格和内容进行精确操作。
论文链接:
https://arxiv.org/abs/2401.14066
转自:“学术头条”微信公众号
如有侵权,请联系本站删除!
上一篇:SUPIR:智能、逼真图像修复技术
下一篇:清华新研究:让GPT-3.5比肩GPT-4