中国移动通信申请模型训练方法专利,基于低秩微调训练得到训练完成的摘要抽取模型

中国移动通信申请模型训练方法专利,基于低秩微调训练得到训练完成的摘要抽取模型
2024年10月24日 09:50 金融界网站

本文源自:金融界

金融界 2024 年 10 月 24 日消息,国家知识产权局信息显示,中国移动通信有限公司研究院及中国移动通信集团有限公司申请一项名为“模型训练方法、装置、设备、存储介质及计算机程序产品”的专利,公开号 CN 118797036 A,申请日期为 2024 年 4 月。

专利摘要显示,本申请公

开了一种模型训练方

法、装置、设备、存储介

质及计算机程序产品。

其中,该模型训练方法

包括:获取第一训练样

本;所述第一训练样本

包括针对对话文本数

据集的训练样本,所述

对话文本数据集包括

一个或多个对话文本数据;将所述第一训练样本输入至预训练

摘要抽取模型中,得到所述预训练摘要抽取模型输出的预测文

本摘要信息;所述预训练摘要抽取模型是基于对多任务模型进

行低秩微调训练后得到的目标参数进行初始化得到的;基于所

述第一训练样本和所述预测文本摘要信息构建第

损失函

数;利用所述第一损失函数对所述预训练摘要抽取模型的第一

目标层的参数进行调整,以得到训练完成的摘要抽取模型;所

述第一目标层为低秩矩阵中的向上映射层。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部