2025年1月6日,昆仑万维“天工大模型4.0”o1版和4o版正式同步上线,并全量登陆天工网页和APP,免费可用。
o1模型(Skywork o1)作为国内第一款中文逻辑推理能力的模型,不仅包含上线即开源的模型,还有两款性能更强的专用版本。经过全方位的技术栈升级和模型优化,由昆仑万维自研的Skywork o1系列能熟练处理各种推理挑战,包括数学、代码、逻辑、常识、伦理决策等问题。
“天工大模型4.0”4o版(Skywork 4o)是由昆仑万维自研的多模态模型,其赋能的实时语音对话助手Skyo,则是一个具备情感表达能力、快速响应能力、多语言流畅切换的智能语音对话工具。
当前,这两款模型已正式登陆昆仑万维旗下天工web与APP,全面向用户开放。
Skywork o1为用户带来更极致的推理能力,正式上线天工web
相较于之前的版本,正式上线的Skywork o1进行了重磅升级,体现在以下三个方面:PRM优化,基于Q*算法的推理系统优化,创新性提出Step-DAPO算法,力争解决训练效果不稳定、计算资源开销过大等问题。
全面升级且正式上线的Skywork o1 Lite / Skywork o1 Preview大幅提升了数学、代码和逻辑推理能力。我们对其进行标准数学基准测试(包括GSM8k、MATH、OlympiadBench、AIME-24以及AMC-23),以及在HumanEval、MBPP、LiveCodeBench及BigCodeBench这四项代码基准测试上评估了Skywork o1的代码能力。
表1丨Skywork o1在数学基准评测上的表现
*备注:对于BigCodeBench,我们采用它的instruct子集进行测试
可以看出,在数学、代码基准测试中,Skywork o1的能力表现逼近o1-mini,显著优于行业常规通用大模型。
Skywork 4o赋能的Skyo,已全面登陆天工APP
为了达成“像和真人一样说话聊天”的效果,Skyo坚持采用更先进的创新路线,通过多模态LLM端到端建模,来解决这个难题。
Skyo的上线是昆仑万维在智能语音交互技术方向,从“操纵机器”迈向“和真人交流”的重要一步。
坚定迈向AGI时代
过去两年,昆仑万维已完成“算力基础设施—大模型算法—AI应用”全产业链布局,并构建起由AI大模型、AI搜索、AI游戏、AI音乐、AI 社交、AI短剧组成的多元AI业务矩阵。我们坚信,所有在模型与产品上进化的每一小步,都是迈向实现通用人工智能的一大步。昆仑万维仍会坚持以技术为底座,以产品为先锋,给用户带来更好的使用体验,为推动人工智能技术的发展和应用做出贡献,立志成为一家小而大美的国际化人工智能企业。
龚斯轩
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有