本文源自:金融界
金融界 2024 年 12 月 18 日消息,国家知识产权局信息显示,北京苹芯科技有限公司申请一项名为“深度神经网络的数据部署系统、训练方法、推理方法、芯片”的专利,公开号 CN 119129675 A,申请日期为 2024 年 8 月。
专利摘要显示,本发明涉及人工智能硬件平台中智能集成电路、智能芯片;人工智能通用技术中深度神经网络等领域,尤其涉及一种深度神经网络的数据部署系统、训练方法、推理方法、芯片。本发明深度神经网络数据部署系统包括:存储模块;矩阵分解模块,用于将原始矩阵分解为 N 个子矩阵的和,N≥2;其中,其中之一的子矩阵被进一步分解为两个或多个低秩矩阵的乘积;矩阵表达处理模块,用于:对于未被分解的子矩阵,将其以第一精度表达后存储;将两个低秩矩阵以第二精度表达后存储;其中,原始矩阵为权重矩阵和/或激活值矩阵,第一精度低于第二精度。本发明在保持模型性能基本不损失的前提下,有效降低了训练和推理过程中所需的存储空间,提高了计算效率。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有