OpenAI重磅发布最新大模型多模态能力有望融入更多应用场景_

北京时间5月14日凌晨，OpenAI发布最新多模态大模型“GPT-4o”，支持文本、音频和图像的任意组合输入，并生成文本、音频和图像的任意组合输出。

今日，多模态AI板块走高，汤姆猫、声讯股份涨停，真视通、盛天网络、金财互联等纷纷跟涨；资金方面，汤姆猫获主力净流入超10亿元，声讯股份超1亿元。

消息面上，北京时间5月14日凌晨，OpenAI举办了线上“春季更新”活动，发布最新多模态大模型“GPT-4o”，支持文本、音频和图像的任意组合输入，并生成文本、音频和图像的任意组合输出。据介绍，GPT-4o的速度比GPT-4 Turbo快2倍，速率限制提高5倍，最高可达每分钟1000万token，而价格则便宜了一半。同时，OpenAI推出有使用限额的ChatGPT Free，新闻稿称，即使是ChatGPT Free（免费）用户也可以有机会体验GPT-4o，但当达到限额时，ChatGPT将自动切换到GPT-3.5。

光大证券研报表示，GPT-4o性能提升，API调用成本显著下降。当前GPT-4o API调用存在一定的限制，GPT-4o多模态模型显著降低延迟。GPT-4o展现出的低成本、低延迟特性将对整个行业产生连锁效应，这将体现在1）推理端降本有望大幅提振应用端需求；2）AI商业化竞争由模型端扩散至基础设施架构。投资建议方面，高性能模型免费开放，推理端降本速度超预期，使更多AI应用在商业上可行；具备多模态能力和情感处理能力的AI语音助手有望融入AR/VR、教育、情感陪伴等场景。

华鑫证券研报分析，从国产搜索产品Kimi及秘塔，到当下GPT-4o的推出，国产化类产品后续的推出也有望重燃市场热度。从投资维度看，传媒应用迎AI推力，可关注AI+陪伴、AI+运动体育教育及运动处方、AI+MR+文化科普虚实体验、AI+文娱、AI+营销及电商、AI+内容。

浙商证券研报认为，以GPT-4o为代表，国内外大模型有望在未来一段时间实现模型性能以及用户交互体验方面的双重迭代，随着模型输出质量、响应时间等维度的不断优化AI应用有望真正实现用户体验和效率提升的赋能，AI有望在各细分行业中持续加速商业化落地，并成为用户的智能助理。