腾讯科技申请模型训练等专利,缩短模型微调训练时间

腾讯科技申请模型训练等专利,缩短模型微调训练时间
2024年10月24日 09:50 金融界网站

本文源自:金融界

金融界2024年10月24日消息,国家知识产权局信息显示,腾讯科技(深圳)有限公司申请一项名为“模型训练方法、问答处理方法、装置及电子设备”的专利,公开号 CN 118797022 A,申请日期为 2024 年 9 月。

专利摘要显示,本申请实施例提供了一种模型训练方法、问答处理方法、装置及电子设备,可涉及人工智能、自然语言处理等领域,该方法包括:获取目标领域的多个带标签的训练样本,基于多个训练样本中的样本问题对神经网络模型不断执行微调操作,得到训练好的目标问答模型,其中,微调操作包括:对于每一样本问题,基于第一模型参数确定样本问题中待调整的各第一分词,并根据第二模型参数对各第一分词的第一特征向量进行调整基于调整后的各第二特征向量以及其他分词的第一特征向量,确定该样本问题对应的预测答复,根据各样本问题的预测答复和标签,对第一模型参数和第二模型参数进行调整。基于该方法,缩短了模型微调的训练时间,有效降低了模型的计算开销。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部