本文源自:金融界
金融界 2024 年 8 月 20 日消息,天眼查知识产权信息显示,上海智臻智能网络科技股份有限公司申请一项名为“图像数据对的生成、图像编辑方法、装置、设备及介质“,公开号 CN202410355835.2,申请日期为 2024 年 3 月。
专利摘要显示,本发明公开了一种高质量图像数据对的生成方法、基于大规模扩散模型的图像编辑方法、装置、设备及介质。图像数据对的生成方法包括:获取提示词文本数据对输入至图像数据对生成模型中,获取与源提示词对应的源图像和与目标提示词对应的目标图像;其中,图像数据对生成模型中包括结构和权重参数相同的第一大规模扩散模型和第二大规模扩模型,且第一大规模扩散模型和第二大规模扩模型中设定层数的注意力图参数共享;如果源图像与目标图像之间的图像相似度超过相似度阈值,则将源图像与目标图像的组合确定为一个高质量图像数据对。本发明实施例可以在高效生成高质量的图像数据对的前提下,训练得到大规模扩散模型进行更高可控性的图像编辑操作。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有