人工智能：国内外大模型发展情况梳理|人工智能_新浪财经

核心观点：2022年11月30日OpenAI发布ChatGPT，随即引爆社交网络，大模型行业进入加速发展阶段。国外基础模型实力强劲、不断精进，开源模型打造庞大应用生态，端侧模型小而美。国内大模型也进入加速成长期，在过去一年中取得了实质性突破。百度文心一言、讯飞星火、清华智谱ChatGLM4、商汤“日日新SenseNova5.0”整体表现逼近GPT-4，开源模型快速进步，文生视频、文生音乐等多模态也取得突破。国内大模型网页流量和应用下载量节节攀升，大模型已经成为日常生活中的重要助手。

国外大模型持续领跑，闭源、开源、端侧模型异彩纷呈。国外大模型主要分为三个层级：性能强劲的闭源模型，具备生态优势的开源模型，以及专注端侧应用的轻量模型。国外基础模型能力持续提升，闭源模型中巨头各显其才。GPT-4性能卓越，始终处于领跑地位，GPT-4o模型实现端到端信息处理，人机交互体验大幅提升；Claude 3后起之秀，整体性能十分强劲；原生多模态大模型Gemini，多模态能力、跨模态能力取得突破。开源模型领域中，LLama2模型塑造了庞大的开源模型家族，LLama3能力大幅提升；Mixtral 8x7B为开源领域引入专家混合技术，成为开源模型的重要力量。端侧应用需要在轻量参数和模型性能之间平衡，Phi-3、Gemma2实现轻量级模型的小而美。国外闭源模型有望迎来突破，我们预期GPT-5或于近期发布，性能改进超预期。

国内大模型进入性能提升的关键时期，模型应用逐步铺开。2022年11月30日OpenAI发布ChatGPT，随即引爆社交网络。国内大模型也进入加速成长期，在过去一年中取得了实质性突破。国内第一梯队的大模型整体能力目前已经逼近GPT-4，部分模型中文能力与GPT-4相差无几。百度文心大模型4.0整体性能优异，成为首个国内面向C端收费的大模型产品；科大讯飞星火大模型V3.5性能逼近GPT-4，6月27日模型即将再度更新；清华智谱ChatGLM4基础模型性能强劲，大模型生态全面对标OpenAI；商汤“日日新SenseNova5.0”大模型，其主流客观评测指标达到或超越GPT-4 Turbo。开源模型阵营中，存在通义千问、百川智能实力强劲的竞争对手。多模态模型中，国产大模型同样进展不断，国产文生视频大模型Vidu发布，对标Sora持续迭代；昆仑万维发布文生音乐大模型天工Skymusic，整体表现不输Suno。国内大模型网页流量和应用下载量节节攀升，安卓应用商店中豆包累计下载1.47亿，讯飞星火累计下载1.06亿，大模型已经成为日常生活中的重要助手。

风险提示：大模型技术发展不及预期、商业化落地不及预期、算力基础设施支持不及预期、政策监管力度不及预期、数据数量与数据质量不及预期。