用AI技术提高生产力,科大讯飞发布智能录音笔SR502 | 钛快讯

用AI技术提高生产力,科大讯飞发布智能录音笔SR502 | 钛快讯
2020年12月02日 22:52 钛媒体APP

“AI价值落地”已经成为了科大讯飞的重要使命,在推动AI技术提高生产力的道路上,科大讯飞消费类硬件的分支之一智能录音笔迎来了一款新品。

12月1日,科大讯飞线上发布新一代讯飞智能录音笔SR502,售价2299元,作为讯飞智能录音笔的热卖机型之一,SR502基于上一代畅销产品SR501进行了软硬件全面升级。

讯飞智能录音笔SR502搭载高性能4核处理器,正面采用一块3.5英寸高清触摸屏,带来了顺滑流畅的系统操作体验,内置2500mAh大容量电池,结合软硬件双重优化,能够实现最长持续录音10小时以上。

作为高性能录音笔产品,SR502配备两颗直径10mm的定向麦克风以及6颗矩阵麦克风,结合讯飞深度定制的Voice Cube声立方技术,实现最远15米拾音距离,以应对各类大型会议、阶梯教室等远距离场景,并能够根据不同场景匹配相应的场景算法,实现最佳拾音效果。

嘈杂环境下,SR502内置的讯飞Focus++智能降噪技术能够有效降低环境音干扰,根据场景主动识别人声,让拾音更加清晰。

不过相比硬件所带来的提升,讯飞智能录音笔SR502在软件方面的升级似乎更吸引人,它希望的是通过前沿人工智能技术的推动智能录音笔产品迭代。

全新升级的讯飞智能录音笔SR502搭载科大讯飞行业首发的离线转写功能,支持用户在无网环境下使用转写并保障隐私内容安全,同时新增OCR文字提取功能。

讯飞智能录音笔SR502使用全新升级的科大讯飞转写引擎——ED新引擎,该引擎搭配全流程的数据资源体系、配套语言学专家以及贯通式的Cloud+ 的闭环迭代模式,采用语种自动路由的多语种端到端的统一建模技术,转写性能大幅提升。

基于端到端的全新语音识别框架,ED新引擎支持自动切换纯中文、纯英文识别模式,同时智能识别中英文混读场景,以及普通话与多地方言的混合场景。配合高性能4核处理器,讯飞智能录音笔SR502将为用户带来更为无缝、高效、准确的多语言记录体验,并且准确率高达98%。

效率提升之外,全新转写ED新引擎为SR502带来了创新的离线转写功能,支持用户在无网环境下正常使用语音实时转写功能,准确率仍旧高达95%。离线转写不仅能够保证消费者在无网环境下使用录音笔功能,更满足了部分用户对敏感机密信息的防泄露需求。

相比上一代产品,SR502新增配备了800万像素高清摄像头,随时利用OCR文字识别功能提取拍摄图片内的文字信息,用户在会议、演讲、活动现场时只需拍摄图片即可获得精准转写的文本内容。同时,SR502拍摄的视频内容支持字幕实时生成,并支持后续编辑,大大降低了视频创作者制作字幕的时间成本。后续的软件版本更新中,SR502还将支持识别Excel表格,并直接导出表格文件。

基于科大讯飞在语音识别领域的深厚积累,讯飞智能录音笔的转写功能支持粤语、河南话、四川话、重庆话、云南话、贵州话、天津话、河北话、东北话、甘肃话、山东话、太原话12种方言转写,并支持藏语、维吾尔语2种少数民族语,同时支持中、英、日、韩、俄、法、越南、西班牙8种语言转写,更支持中英同步互译,翻译结果实时精准播报。

值得一提的是,讯飞智能录音笔还支持财经贸易、医疗、IT科技、政法、文化体育、教育和运营商7大专业领域转写优化,保证相关领域从业者在特定语境下的转写正确率。

在转写内容的预处理上,科大讯飞大力投入语音识别后处理技术。为让用户更高效地利用转写内容,针对多人交谈会议场景,讯飞智能录音笔SR502上线了分离与ASR联合建模的说话人分离方案,说话人分离的准确率达到95%,让用户能够快速检索到各个目标说话人数据。智能语义分段可以根据语义的上下文进行分段,提升了用户针对转写文档的浏览体验;口语规整则可将语气词、重复词、无意义词过滤掉,展示更纯净的转写内容;书签标记支持关键信息的一键标记,有效提升编辑和出稿效率。

作为智能录音笔,SR502内置Wi-Fi、蓝牙、4G网络多种连接方式,在转写内容编辑结束后,支持快速分享至邮件,用户可自定义多种导出格式或模板。此外,独立的讯飞语记应用支持录音笔和PC端随时同步,并支持实时编辑,文件可分享至微信和QQ等常用通讯软件。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部