支付宝申请语音预训练专利,该专利能使语音预训练模型在下游语音任务表现出更好的性能

支付宝申请语音预训练专利,该专利能使语音预训练模型在下游语音任务表现出更好的性能
2024年11月28日 11:37 金融界网站

本文源自:金融界

金融界 2024 年 11 月 28 日消息,国家知识产权局信息显示,支付宝(杭州)信息技术有限公司申请一项名为“语音预训练方法、装置、存储介质及电子设备”的专利,公开号 CN 119028327 A,申请日期为 2024 年 8 月。

专利摘要显示,本说明书实

施例公开了一种语音预

训练方法、装置、存储介

质及电子设备,首先获取

语音样本及语音样本对

应的音素数据,提取语音

样本中各语音帧的语音

特征,并根据语音特征和

音素数据将语音样本划

分为至少一个语音片段,

其中一个语音片段对应

一个音素。然后根据同一音素对应的语音片段中各语音帧的语

音特征确定各个音素的目标特征。进一步地,将各音素的目标

特征作为初始聚类中心,并基于各初始聚类中心将语音样本中

各语音帧的语音特征进行聚类,得到对应的聚类标签。最后利

用聚类标签对预设网络模型进行训练,得到语音预训练模型,

该语音预训练模型能够在下游语音任务表现出更好的性能。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部