南方电网人工智能科技申请代码大模型的训练方法专利,提高模型的输出效果

南方电网人工智能科技申请代码大模型的训练方法专利,提高模型的输出效果
2024年12月04日 21:15 金融界网站

本文源自:金融界

金融界2024年12月4日消息,国家知识产权局信息显示,南方电网人工智能科技有限公司申请一项名为“代码大模型的训练方法、装置、计算机设备和存储介质”的专利,公开号CN 119066419 A,申请日期为2024年8月。

专利摘要显示,本申请涉及一种代码大模型的训练方法、装置、计算机设备和存储介质。所述方法包括:样本指令数据集中包含多种类型的样本指令数据,各类型之间存在类型重叠,每种类型的样本指令数据基于对应类型的实际代码数据得到,服务器获取上述样本指令数据集,并将其输入待训练的代码大模型中,得到各类型预测代码数据,确定待训练的代码大模型中针对各类型样本指令数据预设的动态参数,并根据各类型预测代码数据和对应类型实际代码数据之间的差异,对对应类型的动态参数进行参数调整,以减少不同类型样本指令数据对应的动态参数的调整干扰,得到训练完成的代码大模型。采用本方法能够减少各类型样本指令数据之间的调整干扰,提高模型的输出效果。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部