“超级知识助手”来了,科大讯飞发布首个长文本、长图文、长语音大模型

“超级知识助手”来了,科大讯飞发布首个长文本、长图文、长语音大模型
2024年04月26日 20:27 新快报

新快报讯 4月26日,讯飞星火大模型V3.5(以下简称:讯飞星火)春季上新,发布业界首个长文本、长图文、长语音大模型,不仅能够快速学习各种信息来源的海量文本、图文资料、会议录音等,还能够在各种行业场景给出专业、准确回答。

其首发多情感超拟人合成,具备情绪表达能力,并推出一句话声音复刻功能,让科技更有温度。同时,面向企业应用场景,其推出星火智能体平台,帮助企业解决大模型落地的“最后一公里”难题。根据七麦数据,讯飞星火APP在安卓端的下载量超过9600万次,在国内工具类通用大模型APP中排名第一。

安卓端下载量。

解决和工作相关的刚需问题

为何要做长文本、长图文、长语音的大模型?通过讯飞星火APP可以看到,用户使用的最高峰不是周末,而是工作日的上午九点半和下午三点半。这意味着,大部分用户用讯飞星火来解决和工作相关的刚需问题。而高效的知识获取是用户和开发者都高度关注的问题。

据介绍,此次长文本功能全新升级后,具备长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等能力,总体已经达到GPT-4 Turbo 4月最新长文本版本的97%水平,在银行、保险、汽车、电力等多个垂直领域的知识问答任务上,讯飞星火长文本总体水平已经超过GPT-4 Turbo。

长文本大模型。

为了解决大模型应用效率和准确率问题,科大讯飞董事长刘庆峰谈道,基于讯飞星火V3.5对长文本的理解、学习、回答能力,其进行了重要的模型剪枝和蒸馏,推出业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,在文档上传解析处理、知识问答的首响时间以及文字生成方面都获得了极大的效率提升。测试显示,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本上,星火大模型的性能都做到业界最优。

首推星火图文识别大模型

面向复杂的图文场景,其在图文识别、公式识别大赛多年国际第一的技术积累基础上,首次推出星火图文识别大模型。有三大优势,首先,能够直接处理非常复杂的版面分析,目前已经覆盖31个典型场景,比如书刊、学术论文、专利、报纸、海报、PPT等,同时能自动识别标注出18类不同的版面要素,比如页眉、页脚、标题、段落、表格、公式、印章、手写等。其次,融合篇章上下文语义进行文字识别,识别更精准。此外,面向教育、金融、医疗、科研等专业领域深度优化,其能自动实现更多领域的专业符号识别。

面对广泛的音视频信息高效获取需求,科大讯飞也推出长语音功能,将国际领先的语音识别和翻译技术结合起来,可以实现会议录音、学习视频等的一键研读,实现音视频场景的高效知识获取。

今年全国两会上,开展“人工智能+”行动,加快发展新质生产力首次写入《政府工作报告》。大模型带来的知识管理革命正在上演,无论企业还是个人,都可以站在人工智能的肩膀上,实现新的比较优势。据刘庆峰透露,科大讯飞将在6月27日发布讯飞星火大模型V4.0,进一步解放生产力、释放想象力。

采写:新快报记者 陈慕媛

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部