虽然OpenAI的最新模型o1在性能上显然是一个巨大的进步,但它也正在创造一个潜在的新挑战:产品蔓延。
其最新产品o1和o1-mini本质上给用户和客户提供了一个权衡:你可以等待更长时间,现在可能会花费更多,但输出质量应该会更好。这不是你会接入呼叫中心的那种API,但它确实填补了一个新的利基市场,而该公司已经覆盖了一系列利基市场,远不止“一个几乎什么都做得很好的东西。”
OpenAI的o1用例基本上是“你需要思考一下”的问题。Box公司CEO Aaron Levie给出了一个极好的企业示例,即必须找出合同的一个非常具体的参数——在这个案例中,是合同最终签署的日期,也就是合同生效的日期。这是一个非常明确的“你必须思考一下”的问题:需要解析一个额外的复杂层面来回答一个本来直接的问题,在这个例子中,就是人们可能在不同日期签署合同的可能性。
这也是OpenAI的一种新型用例。以往,这可能需要一长串API调用,并恳求模型以提示调优或检索增强生成(RAG)的形式做他们需要做的事。相反,整个过程可能——假设性地——被压缩成一两个调用,并简化一些架构。
但在这一点上,OpenAI一直在经历一种“SaaS化”的过程,逐渐成熟为一个真正的业务。一些高管和联合创始人继续离开公司,比如联合创始人兼首席科学家苏茨克沃(Ilya Sutskevar)离开创立了一家新的专注于安全的AI初创公司,该公司筹集了10亿美元,以及联合创始人舒曼(John Schulman)离开加入了Anthropic。截至本周,这个名单还包括CTO 穆拉蒂(Mira Murati)。
随着OpenAI成熟为一个真正的企业,它正面临着避免产品蔓延的挑战,而此时其产品组合(或在这种情况下,模型组合)正变得越来越复杂。更大的产品组合本质上更难管理,企业在这个阶段面临的最大挑战是防止它变得难以控制和难以向客户传达价值。随着模型质量的不断提高,任何小的分心都可能导致被其他前沿大模型公司取代。
所以,让我们快速回顾一下OpenAI现在非常庞大的API组合:
GPT-4o:一个多模态、昂贵(虽然不能免于降价)的模型,旨在成为优秀的通用模型。
GPT-4o mini:GPT-4o的轻量版本,替代了主力GPT-3.5 Turbo模型,以满足大量较简单用例的需求。
上述模型的微调版本,以满足企业特定需求;但它们通过API提供,可能会让一些更注重安全的公司望而却步。
上述模型的批处理版本,24小时内完成,价格折扣50%。
o1:以速度和价格换取质量的模型,要用更长时间来“推理”答案,基本上就是需要“停下来想一想”的问题。
o1-mini:o1的轻量版本,也是要回答“停下来想一想”的问题,就算有一系列问题这个模型特别擅长解决吧。
Whisper:可以说是市场上最好的语音文本模型,毫无疑问是为生成OpenAI需要的训练数据而构建的。
文本嵌入:不是最好的嵌入产品,其优势通常似乎是它与其他OpenAI产品一起提供,减少了采购部门的麻烦。
文本转语音:一个API,可以插入到呼叫中心之类的地方,不过有些延迟。有普通版和HD版两种API。
高级语音助手:一个技术上很酷的产品,可以在ChatGPT中主动对话,但杀手级"用例"仍然不是特别清晰。
ChatGPT:OpenAI将上述所有产品“产品化”的版本,集成在一个面向企业的前端封装中。
与上述情况类似,Meta在几乎每一个类别中发布更新的模型,混乱开始增加——除了它们是开放式源代码,并且尽管装到同一个“桶”中,却支持着一系列非常不同的产品。通过o1,OpenAI本质上是在再次尝试创造一个新类别,但同时也冒着产品组合膨胀的风险。
以下是所有定价最终的情况,包括一些竞争对手作为参考点:
而这些成本可能远远不是o1推出一段时间后的最终价格。OpenAI已经开始逐步放宽频次限制,o1-preview最近从每周30次增加到50次,o1-mini从每周50次增加到每天50次。
虽然OpenAI的吸引力一直在于便利性、价格和性能之间的某个甜蜜点,但其不断膨胀的产品组合无疑既是挑战也是机遇。我严重怀疑价格会一直保持这么高,因为它的下一个GPT模型迟早会准备就绪。但目前,至少它在试图筹集巨额融资的时候,把一些定价激进的东西交到了开发者手中。
然而,像任何逐渐成熟的公司一样,随着时间推移开始面临相同的挑战:产品蔓延。虽然OpenAI从技术上讲有“两个”产品,即其API和ChatGPT,但这些产品都有大量分支,服务于非常广泛的用例。API也远不止完成聊天和生成文本,还包括各种各样的模态。而其语音产品可能是其产品组合中最尴尬的部分,看似是ChatGPT的一个“哇塞”点。
产品蔓延在创业界是一个众所周知的问题,如果你还能把OpenAI称为创业公司的话。随着创业公司的成熟,以及用户和客户群的增长,它必须有方向性地发展——预测能满足大多数客户的少数用例,而不是为每个人构建每样东西。或者更简洁地说,做少数几件事,但要做好。
提供如此广泛的用例使OpenAI能够将用户引导到某种稳定状态,在这种状态下它不一定能赚钱,但至少不会亏损。在API方面,传统上一直是将用户推向其主力模型(特别是微调版本),但在ChatGPT方面,这一点就未必如此了。
ChatGPT和推理效率的提升
虽然新模型在ChatGPT中受到速度限制,但这也是其业务中除API之外极其重要的一部分。据The Information报道,OpenAI首席运营官Brad Lightcap告诉员工,OpenAI有超过1000万ChatGPT付费订阅用户,另有100万企业订阅用户。
做点粗略计算,就会得出相同的结论:ChatGPT的企业业务目前是,并且将继续是OpenAI除API之外业务的重要组成部分。
但ChatGPT的收入不会像API那样随着o1的使用直接扩大。实际运行的成本考虑,无论是通过API还是在ChatGPT内部,可能会随着预训练计算资源向推理转移而改变。
幸运的是,对OpenAI来说,这是一个已经有很多进展的领域。我与业内人士交谈时,一个现在正受到大量额外关注的方法是蒙特卡洛树搜索(MCTS),它可以缩减生成高质量结果所需的计算量。另一种“缩小”大模型的方法是蒸馏,也获得了发展势头,因为人们有兴趣管理高性能模型推理成本。
“这就是甜蜜点,将传统预测性机器学习的策略与这些年工作中积累下来的新技术相结合,”模型开发商和平台h2o.ai的联合创始人兼CEO Sri Ambati告诉我。“树搜索绝对是一个天才的技巧,它是一个容易收获的低挂果实,与LLM的出色性能相结合。”
布朗(Noam Brown)在OpenAI的工作最近被经常提及。Brown被广泛认为是博弈论的顶级专家,许多人都在猜测他的工作将如何应用于OpenAI的产品。Brown共同撰写了论文,研究了蒙特卡洛树搜索在开发人类般代理中的应用。
根据我最近与大多数企业和平台的交谈,OpenAI的API面临的挑战,是构建AI应用时成本成为第一或第二位的考虑因素。但OpenAI肯定表现出了随时间推移降低价格以保持竞争力的意愿。
值得注意的是,OpenAI的ChatGPT企业业务似乎是其业务的重要驱动力,使得所有这些开发本质上都是为了服务于企业套件。另一种选择是使用现成的非常便宜的东西在内部构建定制解决方案,这对于那些有更高级治理和成本要求的公司来说越来越有吸引力。
OpenAI一方面会忽悠人们:“嘿,看看,我们仍在构建极其先进的东西,别低估我们的融资需求”。
另一方面,OpenAI已经成熟为一家更适合企业产品的公司。现在OpenAI需要避免的是,不要在销售电话中用庞大的模型组合让企业摸不着头脑。
本文编译来源:
https://www.supervised.news/p/a-rare-opening-against-datadog
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有