本文源自:金融界
金融界2024年5月1日消息,据国家知识产权局公告,华为技术有限公司申请一项名为“一种机器学习模型的训练方法和相关装置“,公开号CN117952168A,申请日期为2022年10月。
专利摘要显示,本申请实施例公开了一种机器学习模型的训练方法和相关装置,用于解决CPU和NPU需要进行频繁的环境交互与网络交互带来带宽压力问题。本申请实施例方法在神经网络处理器上执行,包括:获取样本环境数据;根据样本环境数据训练环境模型;将环境模型与智能体模型进行交互,得到状态动作序列;将状态动作序列提供给智能体模型进行训练,并将训练后的智能体模型继续与环境模型进行交互,直到智能体模型的损失值收敛到预设值,得到训练后的智能体模型。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有