高级语音视觉功能上线,OpenAI 12天直播已过半,还能期待什么?

高级语音视觉功能上线,OpenAI 12天直播已过半,还能期待什么?
2024年12月13日 10:29 格隆汇APP

王炸第6日,OpenAI带着高级语音视觉功能(Advanced Voice with Vision)来了。

现在的ChatGPT能够通过视觉和听觉与用户互动,提供实时的视觉互动体验,就像与真人视频聊天一样自在。

这不仅让其作为AI陪伴工具的体验感大幅提升,也为更高效强大的AI教育工具作出了示范。

能看能听,高情商

实时视频对话、屏幕共享和图像上传,这些在一天内一次性大放送。

实时视频对话

在演示视频中,OpenAI研究员先让向ChatGPT打了招呼,并让现场的其他工作人员做了自我介绍。

在每一个人做完自我介绍后,ChatGPT都会夸赞一下对方的工作,可谓情绪价值拉满。

随后,研究员又提问,带着鹿角/圣诞帽子的同事是谁?ChatGPT给出了准确的回答。

也就是说,ChatGPT能通过视觉认识人。

在另一个演示视频中,研究员准备了一些冲咖啡的设备,ChatGPT很快就认出了面前的设备,并推测出研究员想要冲咖啡,然后就跟研究员讲述了冲咖啡的步骤。

在这个过程中,ChatGPT还贴心地给出了咖啡粉和水量的比例。

当研究员问自己冲咖啡的技术有没有改进的时候,ChatGPT先是给出夸赞,然后再给出需要注意的要点。

在与用户的互动中,ChatGPT的高级语音功能展现出了自然而友好的语调,甚至在对话中适时地发出笑声,给人一种仿佛在与真人交流的感觉。

与ChatGPT共享屏幕

视频中,ChatGPT能够判断出手机正处于短信界面,并理解短信内容。

当用户问该如何回复短信时,ChatGPT的回复非常“高情商”,夸了对方的圣诞装扮非常棒,并委婉地给出对方建议,还附带语气词。

在这一功能下,我们就能随时随地有一位待命能给出建议的牛逼助理。

为了迎合圣诞的节日氛围,ChatGPT还在高级语音里面,新加了一个限定到本月底的新音色Santa

访问上,从周四开始,ChatGPT移动应用将开始向全球(欧洲除外)的Teams、Plus和Pro订阅者推出高级语音视觉功能。

对于欧洲的Pro和Plus用户,OpenAI将尽快提供这项服务。至于企业用户和教育用户,他们将在明年年初获得访问权限。

12天直播已过半

随着OpenAI的12天直播进行到越来越后面,大家的关注可能已经没有一开始的那么多了。

有网友总结了过去6次直播OpenAI上线的内容:

Day 1:满血o1上线,ChatGPT Pro会员上线,o1 pro推出。

Day 2:基于o1的强化微调。

Day 3:Sora正式发布。

Day 4:ChatGPT Canvas全员开放以及小功能更新。

Day 5:给苹果站台,宣传苹果全系接入GPT。

Day 6:4o的实时理解上线。

不过,一般来说,重要的东西往往是放在后面的,后续还有Dalle 4、AI Agent、AI搜索浏览器、猎户座新模型等值得期待。

作为全球AI行业的龙头,OpenAI的任何新动向都是值得保持关注,接下来,格隆汇也将为大家持续跟进OpenAI的直播动态。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部