本文源自:金融界
金融界2024年12月12日消息,国家知识产权局信息显示,东风悦享科技有限公司申请一项名为“一种基于潜在扩散模型的可控数据生成方法、系统及介质”的专利,公开号 CN 119107519 A,申请日期为 2024 年 9 月。
专利摘要显示,本发明涉及一种基于潜在扩散模型的可控数据生成方法、系统及介质,所述方法包括:U1.通过潜在扩散模型的图像编码器,对噪声图片和目标ROI图片进行图像编码,得到噪声图片嵌入的数据信息和ROI嵌入数据信息,并将目标box信息输入MLP模型进行识别,获取目标box嵌入数据信息,并通过潜在扩散模型的自然语言编辑器,对场景提示词进行编码,获取prompt嵌入数据信息;U2.基于所述prompt嵌入数据信息、所述目标box嵌入数据信息和所述ROI嵌入数据信息,采用基于自适应学习的交叉注意力拼接算法对数据进行拼接嵌入。本发明不仅解决目标检测部分场景、极端样本难采集的问题,而且引入目标ROI信息和box信息解决扩散模型生成内容可控性不够精确的问题。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有