GPT-4o来了,更快、更强,还免费,A股人工智能板块大涨

GPT-4o来了,更快、更强,还免费,A股人工智能板块大涨
2024年05月14日 19:44 金融投资报

本文约1800字

阅读完约5分钟

金融投资报记者 陈雨禾

在人工智能领域风头正盛的OpenAI,如今又有了大动作。

在5月14日举办的线上“春季更新”活动中,OpenAI发布了新旗舰生成式AI模型GPT-4o。随后相关话题如“新版GPT可以和人视频互动”“GPT-4o可检测人的情绪”等,相继冲上热搜。

西南交通大学计算机与人工智能学院副教授、博士生导师邢焕来在接受金融投资报记者采访时表示,GPT-4o不仅拥有全面的多模态能力、实时交互性,也具备对语音和情感的深入理解,或将为用户提供一个更加强大、更灵活且易于接触的AI工具。

制图 卿子秀

GPT-4o性能显著提升

据OpenAI官网介绍,GPT-4o中的“o”代表Omni,意为“全能”。作为OpenAI最新发布的旗舰模型,GPT-4o继承了GPT-4的核心功能,并在多个方面进行了显著的优化和提升。

具体来看,在多模态交互方面,无论输入还是输出,GPT-4o都可以综合处理及生成文本、音频和图像的任意组合,因此可以应对更复杂的任务。

相比此前版本,GPT-4o也拥有更好的实时交互能力,与使用者对话基本无延迟,可在232毫秒内响应音频输入,平均响应时长仅320毫秒(此前GPT-3.5为2.8秒,GPT-4为5.4秒),和人类反应速度类似。

在网络直播中,GPT-4o展示了实时推理文本、音频、视觉(图像和视频)等的能力。尤其是在视觉感知方面,模型可以通过摄像头识别并描述画面;在语音方面,即使对话中途被打断,也能继续下去。这些都是实现逼真语音对话的标志,也是当前众多人工智能语音助手普遍面临的技术难点。

更逼真的则是,GPT-4o还被认为拥有一定的情绪感知能力,不仅可通过识别图像或声音感知人的情绪,模型自己也能在一定程度上表达自己的“情绪”,大幅提高了语音交互的质量和准确性。

香颂资本董事沈萌对金融投资报记者表示,“GPT-4o的发布,一方面会掀起新一波AI概念热以及相应的军备竞赛;另一方面,对提高OpenAI的估值也有积极作用。”

免费背后行业“开卷”

金融投资报记者注意到,GPT-4o发布后更受关注的,还是该模型会对所有用户免费开放,无需付费即可使用,提高了其普及性和可访问性。

邢焕来表示,此前,GPT-4和其他高级模型通常仅对付费用户提供,限制了普通用户的直接接触,GPT-4o的免费开放则释放了一些重要信号:

一方面,随着各类大模型的问世,之前依赖的付费订阅、API调用收费的盈利模式增长疲软,GPT-4o的免费开放也意味着OpenAI可能通过扩大用户基础来获取更多的收入,探索新的盈利模式。

另一方面,随着AI市场竞争的加剧,通过提供免费的先进技术,OpenAI可以吸引更多用户使用其产品,进而增加其在AI市场上的影响力和地位。这也意味着OpenAI可能正在加大研发投入,不断推出更具创新性和领先性的产品,以保持其在激烈竞争中的优势地位。

对于OpenAI本身来说,将GPT-4o模型免费开放的决策也是非常具有魄力的,会带来用户基础扩大、各类成本增加、激发创新和应用的多样性、数据和反馈的增加等多方面的影响。尤其是GPT-4o免费开放后,OpenAI原有的模型订阅和API付费调用的盈利模式也会受到影响,这也将逼迫其必须尽快找到新的盈利模式。

事实上,随着GPT-4o的发布,市场对它的讨论也不全是看好的声音。

5月14日上午,猎豹移动董事长兼CEO、猎户星空董事长傅盛发布短视频评价称,一方面,OpenAI发布应用恰恰说明了应用在人工智能领域大有可为,每一个创业者都应该去好好地做人工智能应用;另一方面,如果不计成本地堆积参数,提高所谓的大模型能力,肯定是容易遇到困难的。目前看来,GPT-5可能还要难产一段时间。

在OpenAI推出“对所有用户免费开放”的GPT-4o之前,不少大厂的AI产品,如Deepseek、Claude3、GLM等,都呈现出了降价趋势。因此,有部分观点认为,在大模型行业竞争日渐加剧的情况下,叠加相关技术迭代优化且成本下降的趋势,AI领域新一轮的技术战和价格战或将随之开启。

国内AI市场面临挑战

5月14日,A股人工智能相关板块逆市上涨,其中虚拟人、多模态模型、AI算力等概念股涨幅居前,相关公司也成为市场关注焦点。

部分多模态模型概念股涨幅

关于GPT-4o对国内大模型行业的影响,邢焕来表示,这是机遇也是挑战。

首先,从技术方面来看,OpenAI成功为国内大模型行业提供了一条可能的发展路径:三模态端到端实时输入输出是可行的,并且能极大地提高模型的情感理解能力。

其次,在AI应用领域,由于GPT-4o的实时响应能力显著提升,意味着AI的交互体验将会更加流畅,这在一定程度上扩展了AI的应用范围。

此外,GPT-4o能更好地支持多模态,并且有着强大的用户交互能力,这也使得AI的应用领域更加丰富,并且能大幅提高如手机语音助手等应用的业务能力。

在邢焕来看来,GPT-4o的发布同样带来了挑战。美国企业在AI产业布局上主要有技术生态优势、高质量大数据优势、拥有较为完善的科技风险投资市场等优势。这些优势使得他们在AI领域的竞争力更强,对国内AI产业形成了压力。

除了有OpenAI的GPT-4o发布以外,其他巨头在人工智能领域的布局也备受关注。

例如,美东时间5月14日13时(北京时间5月15日1时)举行的谷歌2024年I/O开发者大会,其中包括安卓15等涉及人工智能的内容就成为了市场关注的焦点;另一边,苹果公司即将官宣的人工智能领域的最新进展也受到关注。有消息称,苹果公司将基于一个全新的生成式AI系统对Siri进行升级。

随着大语言模型性能的不断提高,以及AI技术的发展,其中可能存在的数据隐私安全问题、技术伦理问题和社会问题等,同样引发关注。

“随着AI在我们日常生活中占据的比重越来越高,数据隐私和安全问题的重要性越发凸显。如何确保用户数据的安全和隐私,将成为一个重要议题。”邢焕来表示,“在AI技术发展带来便利的同时,也会在一定程度上代替人力在某些传统领域上的地位,比如自动化业务和在线客服等,从而影响传统岗位的就业情况,引发就业、伦理等社会问题。”

财经时评

OpenAI做搜索,难!

记者 薛蕾

ChatGPT再次更新,但这次市场认可度显然没有前几次高,大家翘首以盼的搜索功能没有上新,网传的OpenAI要入局搜索引擎,市场的宏大志愿也偃旗息鼓。

可惜,但并不意外。

搜索引擎市场不是说进就能进的。搜索引擎市场长期被谷歌、百度等巨头牢牢占据,不仅拥有庞大的用户基础,而且在数据处理、算法优化、用户体验等方面积累了深厚的技术优势。

ChatGPT作为一个新兴的AI模型,在自然语言处理方面的确取得了令人瞩目的成就,但搜索功能的开发不仅仅是技术层面的突破,更需要对市场进行深入的理解和适应。搜索功能的集成需要考虑到用户习惯、搜索效率、信息准确性等多方面的因素,这些都不是一蹴而就的。

再者,OpenAI做搜索可能也不被老大哥微软所容。这两家表面上是亲密的合作伙伴,但OpenAI再不想承认也不行:微软在这场合作中具有绝对的主动权。

两家公司合作,微软可以和谷歌联手入局大模型分OpenAI的面包,同时也可以在其多个产品线中集成ChatGPT。但反过来看,OpenAI没有这么做的资本。

两家的合作但凡遇到难题,必须有一方要让步,而让步的一方大概率是OpenAI。如果OpenAI上新搜索功能,就必须确保新功能的添加不会破坏现有的用户体验,同时要保证与微软产品的无缝兼容性。如果搜索功能的集成在技术上还未完全成熟,或者存在与现有系统集成的复杂性,那就很难上新。

退一步说,就算微软同意OpenAI做搜索,没有任何技术积累的OpenAI能依仗的也只有微软。但目前的技术共享可能涉及知识产权、数据隐私和安全等多方面的考量。如果搜索功能的实现需要特殊的数据集或算法优化,而这些在技术共享的框架下还未完全解决,那么这也可能是搜索功能尚未推出的原因之一。

上周,微软刚刚宣布与谷歌联手入局生成式AI,本周OpenAI的搜索引擎计划就落空了,这很难让人不多想:是不是微软和OpenAI的合作过程出现了什么问题,或者出现了利益冲突?但这也只是猜测,具体原因是什么,可能还要看OpenAI下一步的动作和微软的态度。但难,确实很难。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部