本文源自:金融界
金融界 2024 年 11 月 28 日消息,国家知识产权局信息显示,支付宝(杭州)信息技术有限公司申请一项名为“语音预训练方法、装置、存储介质及电子设备”的专利,公开号 CN 119028327 A,申请日期为 2024 年 8 月。
专利摘要显示,本说明书实
施例公开了一种语音预
训练方法、装置、存储介
质及电子设备,首先获取
语音样本及语音样本对
应的音素数据,提取语音
样本中各语音帧的语音
特征,并根据语音特征和
音素数据将语音样本划
分为至少一个语音片段,
其中一个语音片段对应
一个音素。然后根据同一音素对应的语音片段中各语音帧的语
音特征确定各个音素的目标特征。进一步地,将各音素的目标
特征作为初始聚类中心,并基于各初始聚类中心将语音样本中
各语音帧的语音特征进行聚类,得到对应的聚类标签。最后利
用聚类标签对预设网络模型进行训练,得到语音预训练模型,
该语音预训练模型能够在下游语音任务表现出更好的性能。

4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有