面对美国AI芯片新限制，科大讯飞、MiniMax等多家中国公司用大模型实力回应

（图片来源：钛媒体AGI编辑林志佳拍摄）

美国新一轮全球AI算力出口管制公布不到48小时内，五家中国 AI 企业集体公布大模型新品和相关技术进展，用“实力”进行回应。

钛媒体AGI获悉，1月15日上午，AI上市公司科大讯飞发布国产深度推理大模型“讯飞星火X1”，这是科大讯飞与华为联手训练出的中国首个基于全国产算力的具备深度思考和推理能力的大模型，对标OpenAI o1系列，中文数学能力国内第一，并率先应用于教育、医疗等刚需场景。同时，科大讯飞还公布讯飞星火4.0 Turbo升级版、国内首个具备端到端语音到语音同传能力的星火语音同传大模型。

几乎同一时间，“大模型六虎”MiniMax和月之暗面也分别推出全新模型和服务。此外，15日下午，AI视频模型公司生数科技对外公布Vidu 2.0版本，生成速度最快不到10秒，单秒视频成本仅需“4分钱”；面壁智能则公布端侧4o实时语音互动模型MiniCPM-o 2.6，具备全模态，端到端，实时音视频通话。

截至目前，全球 AI 企业总量超过4万家，其中，中国生成式 AI 产业蓬勃发展，中国生成式 AI 产品用户规模高达2.3亿人，产业规模和产品数量迅速增加，初步构建了较为全面 AI 产业体系，相关企业超过4500家，核心产业规模已接近6000亿元，产业链覆盖芯片、算法、数据、平台、应用等上下游关键环节。同时，中国已经完成备案并对外服务 AI 大模型超过270个，总注册帐户数超过13亿。

在美国不断加大 AI 限制之下，中国 AI 创业公司正在用实力与美国顶尖技术进行比拼。

AI“国家队”出击：国产深度推理大模型“讯飞星火X1”多项能力超o1

1月15日，科大讯飞公布讯飞星火X1、讯飞星火4.0 Turbo升级版、具备端到端语音到语音同传能力的大模型——星火语音同传大模型三款产品。

首先，讯飞星火X1是基于全国产算力平台上唯一的深度推理大模型，与通用大模型相比，讯飞星火X1解题过程更接近人类的“慢思考”方式，不仅准确给出答案，还对解题思路和步骤进行了详细拆解，且化繁为简，将复杂问题分步拆解简化，进行自我探索和反思验证，以及基于答案正确与否的优质反馈信息进行强化训练。在小初高（含竞赛）、大学（含竞赛）等多项中文“考试”中，讯飞星火深度推理模型X1用更少的算力，多项指标国内第一，能力超过美国OpenAl公司的o1、o1 Preview模型。此外，医疗领域，讯飞星火X1可使得专科辅助诊断和复杂病历内涵质控准确率均达90%。

科大讯飞还宣布，将在今年上半年正式发布基于讯飞星火X1的医疗大模型升级版。

其次，讯飞星火4.0 Turbo也全面升级，数学能力、行业知识、图文识别、长文本能力等能力上实现提升，全面对标GPT-4o。其中，讯飞星火4.0 Turbo图文识别能力升级，使通用文档版面分析、文字识别的准确率相对提升40%，复杂表格结构、潦草手写文字等方面准确率相对提升60%，大幅提升高价值数据获取能力，而基于“技术+应用”不断正向循环，讯飞星火4.0 Turbo在金融、油气、能源、电力、钢铁、航司等领域综合能力的绝对提升全部超过10%。

最后，科大讯飞发布国内首个具备端到端语音同传能力的大模型——星火语音同传大模型，可以最快实现仅5秒的同传时延，达到人类专家译员水平，在内容完整度、信息准确度以及语言质量上与GPT-4o旗鼓相当。发布会上，科大讯飞透露，针对语音到语音的同传场景，讯飞翻译机将会配置耳机、音箱、麦克风，在2025年推出商务套装，满足用户在不同商务洽谈场景使用需求。

事实上，科大讯飞于2019年、2022年曾两次被列入美国实体清单，最终成功应对。科大讯飞表示，其核心技术研究和产品开发平台逐步实现全面自主可控，在国产算力构建高性能模型已经有良好基础。

当前，科大讯飞正全面发力 AI 大模型商业化。财报显示，2024年前三季度，科大讯飞实现营业收入148.49亿元，同比增长17.73%；归属于上市公司股东的净利润亏损3.44亿元。

其中，2024年第三季度，科大讯飞实现营业收入55.25亿元，同比增长15.77%；归属于上市公司股东的净利润5696.14万元，同比增长120.87%，在加大星火大模型研发投入和布局的同时，实现利润当季度转正。

科大讯飞董事长刘庆峰曾于去年1月提到，2024年讯飞大模型四大年度战略目标：星火通用大模型国内领先对标GPT-4；赋能智能硬件终端1000万、独立软件用户数过亿；教育、医疗、汽车等多个领域行业市场第一；汇聚100万大模型开发者打造行业第一生态。

科大讯飞近期表示，星火大模型商业化已经得到初步验证，在消费者、教育、医疗、汽车等已有场景中加快规模化落地，商业价值闭环已得到初步验证；同时，以大模型为切入点，在运营商、金融、能源、交通等重点行业做深做透，与央国企战略合作深度运营有望打开增量空间；此外，科大讯飞希望通过先发优势，打造iFlyCode、招采、会议、文档、翻译等标准化产品，企业市场的规模化推广实现商业价值。

生数公布4分钱AI视频模型Vidu，“大模型六虎”发力新技术落地

1月15日下午，生数科技fabu1AI视频模型Vidu 2.0，在速度、价格和模型效果上展现出新的竞争力。

速度方面，Vidu 2.0实现秒级生成，视频生成速度突破至10秒以内，相较于之前版本提升三倍，大幅领先于国外同类产品。对于广告制作、影视动画等专业场景，将带来显著的效率提升。例如传统1分钟广告片交付周期约1个月，Vidu 2.0理想状态下仅需5分钟就能产出足够素材。

价格上，Vidu 2.0推出全新套餐，直接将成本降至单秒视频仅需4分钱，横向对比，其720P收费仅为行业平均的43%，不到业内平均价格一半。这意味着百元左右就能产出1分钟商业片，极大降低了创作成本。与此同时，还上线 “错峰模式”，支持闲时不限量生成，不扣积分，进一步为用户降低使用门槛。

模型效果上，Vidu 2.0也实现全面升级。在风格一致性上，能完整理解并保持风格元素，如在油画、水墨等风格生成中表现出色，远超其他竞品；镜头运动表现自然流畅，对镜头运动指令理解到位；首尾帧性能提升，过渡更加丝滑，场景和镜头切换更具想象力；参考生视频稳定性更强，主体相似度更高。

值得一提的是，Vidu研发团队也罕见公布了运营数据。据悉，自2024年7月底全球上线以来，Vidu 仅用了20天用户数就突破百万，上线100天用户数就突破千万，截至目前来自全球200个国家和地区用户在 Vidu 平台上共计生产了上亿条视频。

另外，“大模型六虎”于15日公布了 AI 大模型产品进展。

其中，MiniMax发布并开源新一代01全新系列模型，参数量高达4560亿，其中单次激活459亿，包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01，同时能够高效处理全球最长400万token上下文，是GPT-4o的32倍，Claude-3.5-Sonnet的20倍，而且MiniMax-01系列模型是该公司首次大规模实现线性注意力机制，传统Transformer架构不再是唯一的选择。
月之暗面则公布Kimi多模态图片理解模型moonshot-v1-vision-preview API，100万tokens售价12元起。

MiniMax认为，2025年将是 AI Agent（智能体）高速发展的关键年份，无论是单Agent系统还是多Agent系统，都需要更长的上下文来支持持续记忆和大量通信。MiniMax-01系列模型推出将满足新需求，迈出建立复杂Agent基础能力的第一步。

目前，MiniMax-01系列开源模型已应用于MiniMax旗下产品海螺AI，并在全球范围内上线，企业与个人开发者可前往MiniMax开放平台使用API。

生成式AI产业转向商业化，美国“打不死”中国 AI 发展

中国生成式 AI 支出和产业规模不断扩张。

据IDC统计，2022年，全球 AI 总投资规模为1324.9亿美元，并有望在2027年增至5,124.2亿美元，年复合增长率31.1%。预计到2027年，45%的企业将掌握并使用生成式 AI 来共同开发数字产品和服务从而推动收入增长。

多个数据预测，到2027年，全球生成式AI市场规模将接近1500亿美元。其中，中国生成式 AI 市场规模将达到400亿美元以上。

ChatGPT风靡全球两年多时间里，中国出现了300多个大模型。截至目前，10亿参数规模以上大模型数量更是超过了100个，远超美国大模型数量。

性能方面，中国后来居上，比如阿里云通义千问大模型Qwen2-72B模型，在性能上不仅超过了文心4.0、豆包pro、混元Pro等国内的闭源大模型，也超越了美国最强开源模型Llama3-70B。

北京市科学技术研究院科技情报研究所书记、所长张士运认为，中国 AI 快速崛起并非偶然，背后离不开多重因素的协同作用。

不过，生成式 AI 的应用仍然处于早期阶段，在企业层面落地仍面临许多挑战。比如，数据处理工具和解决方案面临缺失，算力与模型适配面临困境，大模型部署复杂性和协同难度大，应用难题亟待解决等。

2024世界智能制造大会期间发布的数据显示，中国已建成1200多家先进级智能工厂和230多家卓越级智能工厂。全球172家“灯塔工厂”中有72家建在中国，占比超过42%。截至2024年10月底，智能制造装备产业营收同比增长28%，工业软件产品收入同比增长7%，智能协作、物流仓储机器人产量持续领跑全球。

刘庆峰认为，国内大模型将从“百模大战”转向若干个“主要玩家凸显”态势。中国必须要有自主可控、对标国际一流通用大模型。通用大模型每次迭代都将“淹没”一批弱的行业模型和应用。

中国科学院脑科学与智能技术卓越创新中心研究员张铁林指出，文本大模型更新迭代进程明显受到了文本数据量和资源条件方面的限制。一方面，现今互联网上公开的人类自然语言文本语料，在很大程度上都已被机器“学习利用”。另一方面，训练千亿甚至万亿参数AI大模型，不仅要耗费巨量电力能源，还需要数以万计AI芯片提供算力支持，这无疑意味着巨额资本投入。一些急于看到回报的资本开始纷纷撤离，导致那些缺乏支持的 AI 大模型项目不得不停滞。因此，在短期内能否发展出具备人脑综合高级认知能力的AI大模型，仍需进一步观察和研究。

对于美国《人工智能扩散出口管制框架》新规即将实施，甲骨文执行副总裁肯·格鲁克表示，“美国此举等于把百分之八十的全球市场拱手送给中国”。

谷歌前首席执行官埃里克·施密特（Eric Emerson Schmidt）近期对中国 AI 看法发生了180度转变。他认为，事实是，中国 AI 技术看起来已经追上了美国，尤其是限制高性能芯片供应给中国之后发生的事。

展望未来，特斯拉CEO埃隆·马斯克（Elon Musk）则预言，通用人工智能（AGI）将最快在2025年底实现，2027年和2028年 AI 可能比人类的全体智慧还要聪明。这意味着，如果到2030年 AI 超过了人类智能的总和，AI将承担大部分知识性工作。

全球范围内，AI 将逐步演变为一种新的基础设施，深刻改变社会运作模式和经济发展逻辑，从工业到医疗，从教育到文化，AI 以独特方式塑造未来社会，也为构建更加智能化、互联化社会提供了无限可能。

按照中国《新一代人工智能发展规划》，到2025年，中国 AI 基础理论实现重大突破，部分技术与应用达到世界领先水平，AI 成为带动中国产业升级和经济转型的主要动力，智能社会建设取得积极进展。到2030年，AI 理论、技术与应用总体达到世界领先水平，成为世界主要 AI 创新中心，智能经济、智能社会取得明显成效，AI 产业竞争力达到国际领先水平。形成涵盖核心技术、关键系统、支撑平台和智能应用的完备产业链和高端产业群，AI 核心产业规模超过1万亿元，带动相关产业规模超过10万亿元。

智源研究院创始理事长，美国国家工程院外籍院士张宏江对钛媒体AGI表示，物理模型、世界模型是人类走向AGI的必经之路，2025年 AI 领域一定会有一些突飞猛进的进展。

张士运强调，当前这个转折点上，中国 AI 不仅要致力于成为技术领导者，更要努力成为未来社会发展方向的塑造者，把握这一机遇，我们将迎来一个更加智慧、更加可持续发展的未来。

（本文首发于钛媒体App，作者｜林志佳，编辑｜胡润峰）