封面新闻记者 欧阳宏宇
“AI应用落地元年”刚过,2025一开年,人工智能大模型在国产化和智能化上再进一步。
1月15日,科大讯飞发布深度推理大模型“讯飞星火X1”。据了解,该大模型为科大讯飞携手华为,基于全国产算力“训练”出的具备深度思考和推理能力的大模型。全新大模型产品的出现,背后是我国算力产业发展动能持续强劲,算力基础设施完善为AI厂商们带来新⼀轮发展机遇。
从大模型的演进路径出发,探索其高质量发展的“中国路径”,是我国抢占科技制高点的重要战略。在此之前,文心一言、零一万物等中国造通用大模型都用上了中国算力。其中,支持文心一言的阳泉智算中心是亚洲单体最大的智算中心;零一万物在去年底与智能算力运营服务厂商图灵新智算达成合作,要打造公共算力服务平台。
在国产算力供给方面,工信部《算力基础设施高质量发展行动计划》显示,2023年我国算力规模达到220EFLOPS,其中智能算力占25%,目标到2025年,算力规模超过300EFLOPS,智能算力占比达到35%。截至2024年6月,全国在用算力中心机架总规模超过830万标准机架,算力总规模达246EFLOPS。
国产算力供给增加
带动大模型技术升级
事实上,布局国产大模型研发,规范大模型建设生态,统筹优化通用与行业大模型发展,早在大模型元年就已开始。2023年10月,首个国产万卡算力集群“飞星一号”平台上线;一年后,国产超大规模智算平台“飞星二号”正式启动,引领国产大模型底座的发展。
算力供给的增加,也带动了国产AI大模型技术的升级。据了解,目前,基于全国产算力研发的,唯一一个全国产算力上训练的深度推理模型已经推出,并在教育、医疗等真实场景中实现了应用落地。
与通用大模型相比,所谓的“深度推理模型”更接近人类的“慢思考”方式,并且用更少的算力。据介绍,该类模型有三大典型特征:一是化繁为简,将复杂问题分步拆解简化;二是进行自我探索和反思验证;三是基于答案正确与否的优质反馈信息进行强化训练。
AI“慢思考”范式出现
人机互动将更智能
在此之前,OpenAI推出的大模型o1已探索出,通过强化学习让AI具备人类的,主动反思、纠错等复杂思考能力的“慢思考”范式。如今,全国产算力也实现了让中国造AI大模型具备了这样的能力。
以X1大模型为例,例如在解答高考题、高中奥赛题时,不仅能准确给出了这些题目的答案,还可以对解题思路和步骤进行了详细拆解。在医疗领域,这一计算范式可使得专科辅助诊断和复杂病历内涵质控的准确率均达90%。
这种技术的进步所带来的是AI大模型拟人能力上的巨大进步。在此之前,由于机器学习技术的广泛使用,市面上大量通用大模型的训练原理是,通过大量知识和数据的训练,让大模型具备“快思考”能力,即让AI拥有快速直觉、无意识,快速反应的能力。
“但这样的缺陷在于,能力不够强。”业内人士分析称,这也是为什么不少大模型面对问题出口成章,但回答质量不够稳定,时常出现机器幻觉。相较而言,慢思考具备有意识、有逻辑性的特征,虽然需要分很多步骤,但会在回答之前进行一段时间的“思考”,有助于模型避免出错,并提供更全面的解答。
这种大模型底层范式的变化,也是变革大模型科研和应用范式,形成中国特色大模型应用领跑优势的具体体现。在中国工程院院士陈晓红看来,国产AI工程化工具研发提速,能有力回应各行业AI赋能的强烈需求,形成贯通算力、算据、算法、应用的大模型赋能产业生态。“这将有助于鼓励创新大模型应用场景,加快在医疗、金融、法律、教育、交通等行业的落地应用,借助AI完成重点领域弯道超车,打造一条大模型高质量发展的‘中国路径’。”
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有