人工智能:国内外大模型发展情况梳理

人工智能:国内外大模型发展情况梳理
2024年05月15日 20:38 中信建投证券股份有限公司

核心观点:2022年11月30日OpenAI发布ChatGPT,随即引爆社交网络,大模型行业进入加速发展阶段。国外基础模型实力强劲、不断精进,开源模型打造庞大应用生态,端侧模型小而美。国内大模型也进入加速成长期,在过去一年中取得了实质性突破。百度文心一言、讯飞星火、清华智谱ChatGLM4、商汤“日日新SenseNova5.0”整体表现逼近GPT-4,开源模型快速进步,文生视频、文生音乐等多模态也取得突破。国内大模型网页流量和应用下载量节节攀升,大模型已经成为日常生活中的重要助手。

国外大模型持续领跑,闭源、开源、端侧模型异彩纷呈。国外大模型主要分为三个层级:性能强劲的闭源模型,具备生态优势的开源模型,以及专注端侧应用的轻量模型。国外基础模型能力持续提升,闭源模型中巨头各显其才。GPT-4性能卓越,始终处于领跑地位,GPT-4o模型实现端到端信息处理,人机交互体验大幅提升;Claude 3后起之秀,整体性能十分强劲;原生多模态大模型Gemini,多模态能力、跨模态能力取得突破。开源模型领域中,LLama2模型塑造了庞大的开源模型家族,LLama3能力大幅提升;Mixtral 8x7B为开源领域引入专家混合技术,成为开源模型的重要力量。端侧应用需要在轻量参数和模型性能之间平衡,Phi-3、Gemma2实现轻量级模型的小而美。国外闭源模型有望迎来突破,我们预期GPT-5或于近期发布,性能改进超预期。

国内大模型进入性能提升的关键时期,模型应用逐步铺开。2022年11月30日OpenAI发布ChatGPT,随即引爆社交网络。国内大模型也进入加速成长期,在过去一年中取得了实质性突破。国内第一梯队的大模型整体能力目前已经逼近GPT-4,部分模型中文能力与GPT-4相差无几。百度文心大模型4.0整体性能优异,成为首个国内面向C端收费的大模型产品;科大讯飞星火大模型V3.5性能逼近GPT-4,6月27日模型即将再度更新;清华智谱ChatGLM4基础模型性能强劲,大模型生态全面对标OpenAI;商汤“日日新SenseNova5.0”大模型,其主流客观评测指标达到或超越GPT-4 Turbo。开源模型阵营中,存在通义千问、百川智能实力强劲的竞争对手。多模态模型中,国产大模型同样进展不断,国产文生视频大模型Vidu发布,对标Sora持续迭代;昆仑万维发布文生音乐大模型天工Skymusic,整体表现不输Suno。国内大模型网页流量和应用下载量节节攀升,安卓应用商店中豆包累计下载1.47亿,讯飞星火累计下载1.06亿,大模型已经成为日常生活中的重要助手。

风险提示:大模型技术发展不及预期、商业化落地不及预期、算力基础设施支持不及预期、政策监管力度不及预期、数据数量与数据质量不及预期。

海量资讯、精准解读,尽在新浪财经APP
人工智能 闭源

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 04-29 瑞迪智驱 301596 25.92
  • 04-25 欧莱新材 688530 9.6
  • 04-01 宏鑫科技 301539 10.64
  • 03-29 灿芯股份 688691 19.86
  • 03-27 无锡鼎邦 872931 6.2
  • 新浪首页 语音播报 相关新闻 返回顶部