中国移动通信申请模型训练及 ASR 文本修正专利,能够准确进行语音识别并实现中文的替换修正

中国移动通信申请模型训练及 ASR 文本修正专利,能够准确进行语音识别并实现中文的替换修正
2024年10月24日 10:30 金融界网站

本文源自:金融界

金融界 2024 年 10 月 24 日消息,国家知识产权局信息显示,中国移动通信集团浙江有限公司、中国移动(浙江)创新研究院有限公司、中国移动通信集团有限公司申请一项名为“模型训练方法及 ASR 文本修正方法”的专利,公开号 CN 118797331 A,申请日期为 2023 年 12 月。

专利摘要显示,本发明提供一种模型训练方法及 ASR 文本修正方法,属于人工智能领域,其中,ASR 文本修正方法应用训练后的 BERT 模型,包括:获取主叫文本并确定主叫文本的第一困惑度;对主叫文本进行分词处理得到多个词语;将多个词语均转换为拼音;对于每一个词语,当根据预构建的关键词拼音库确定词语的拼音不是关键词拼音,但是在关键词拼音的一步编辑距离范围内的情况下,将关键词拼音对应的关键词确定为候选词;根据候选词对词语进行替换,得到替换文本,并确定替换文本的第二困惑度,当第二困惑度小于第一困惑度时,输出替换文本。本发明利用训练后的 BERT 模型进行 ASR 文本修正能够准确的进行语音识别并实现中文的替换修正。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部