本文源自:金融界
金融界 2024 年 10 月 24 日消息,国家知识产权局信息显示,中国移动通信集团浙江有限公司、中国移动(浙江)创新研究院有限公司、中国移动通信集团有限公司申请一项名为“模型训练方法及 ASR 文本修正方法”的专利,公开号 CN 118797331 A,申请日期为 2023 年 12 月。
专利摘要显示,本发明提供一种模型训练方法及 ASR 文本修正方法,属于人工智能领域,其中,ASR 文本修正方法应用训练后的 BERT 模型,包括:获取主叫文本并确定主叫文本的第一困惑度;对主叫文本进行分词处理得到多个词语;将多个词语均转换为拼音;对于每一个词语,当根据预构建的关键词拼音库确定词语的拼音不是关键词拼音,但是在关键词拼音的一步编辑距离范围内的情况下,将关键词拼音对应的关键词确定为候选词;根据候选词对词语进行替换,得到替换文本,并确定替换文本的第二困惑度,当第二困惑度小于第一困惑度时,输出替换文本。本发明利用训练后的 BERT 模型进行 ASR 文本修正能够准确的进行语音识别并实现中文的替换修正。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有