本文源自:金融界
金融界2024年12月2日消息,国家知识产权局信息显示,北京龙智数科科技服务有限公司申请一项名为“视频生成方法、装置、电子设备及可读存储介质”的专利,公开号 CN 119052529 A,申请日期为 2024 年 7 月。
专利摘要显示,本申请涉及人工智能技术领域,提供了一种视频生成方法、装置、电子设备及可读存储介质。该方法包括:获取风格参考图和文本描述;基于所述风格参考图,得到风格文本描述和风格图像特征,基于所述风格文本描述和文本描述,得到目标文本描述,并对所述目标文本描述进行特征处理,得到目标文本特征;确定用于生成目标视频的视频帧噪声图和运动噪声图,将所述风格图像特征、所述目标文本特征、所述视频帧噪声图以及所述运动噪声图输入至扩散模型,得到所述扩散模型输出的预测视频帧,并基于所述预测视频帧,得到所述目标视频;本申请可以生成视觉连续性更强运动更加自然的视频同时可以减少视频闪烁和伪影现象,提升生成视频的整体质量。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有