本文源自:金融界
金融界2024年12月2日消息,国家知识产权局信息显示,南方电网人工智能科技有限公司申请一项名为“模型训练方法、装置、计算机设备、存储介质和程序产品”的专利,公开号CN 119047523 A,申请日期为2024年8月。
专利摘要显示,本申请涉及一种模型训练方法、装置、计算机设备、存储介质和程序产品,所述方法包括:获取用于对初始语言模型进行训练的样本张量;并确定与样本张量维度相同的掩码张量;采用掩码张量对样本张量进行稀疏化操作,得到稀疏化张量;进而根据稀疏化张量对初始语言模型进行训练,以得到目标语言模型。上述方案,在对初始语言模型训练之前,通过对样本张量进行稀疏化处理,可以减少模型训练的计算量,进而提高模型训练效率。

4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有