大厂视角来看一下国产AI追赶海外进度_

Q：今晚我们有幸邀请到专家，从大厂视角来看一下国产AI追赶海外进度。能否先介绍一下今晚会议的主要内容？

A：今晚的会议主要分为三部分。首先，我们将请专家从大厂的角度比较国内互联网巨头的语言模型水平，并分享其在追赶最新模型如Follow方面的进度。其次，我们将探讨各大厂的组织架构，以判断其在提高效率方面的能力。最后，我们将聚焦于多模态读图功能这一新方向，了解其目前的发展状况。

Q：能否介绍一下国内互联网巨头目前的语言模型情况？对于大厂之间语言模型的对比，您的观点是什么？

A：国内互联网巨头的语言模型大致可以分为几个方向，如百度的文心、阿里的同意、腾讯的会员模型等。这些模型已经具备相关能力，且在评测集上的效果相对较好，如在NLP任务和复杂推理问题上表现突出。目前来看，国内头部公司的语言模型总体水平已达到3.5甚至略超过这一水平。根据我们构建的benchmark评估，百度在语言模型方面略优于其他大厂，如同意和会员。然而，第三方评估如enchant k的结果可能有所不同。总体而言，百度在语言模型方面表现较好，但与海外先进水平仍有一定差距，正朝着更先进的4.0方向追赶。

Q：除了大厂外，国内其他公司在语言模型方向的表现如何？

A：一些偏小公司也在语言模型方向表现不错，尤其是在视觉模型方面，如纹身图技术。目前大部分国内视觉模型基于开源技术，整体差距不大。

Q：对于多模态读图这个新方向，国内的进展如何？

A：多模态读图是一个相对较新的方向，目前国内外均处于研发阶段，尚未推出成熟的demo。国内创业型小公司有一些相关demo可用，但整体效果并不理想。多模态读图涉及文本和图像的理解，需要构建端到端的多模态模型，这是一个相对较难的方向。

Q：目前在多模态图像理解领域，国内哪家公司已经开放了相关能力？

A：目前我了解到国内还没有哪家公司公开了具备多模态图像理解能力的产品。

Q：能否分享一下对于腾讯、字节等大厂在复现纹身视频模型时的技术路径及进度？

A：复现纹身视频模型主要包括了解数据集、模型结构和参数量级，并进行模型训练和人工对齐。具体来说，需要先了解训练模型所使用的语料量、整体参数量级，并搭建模型框架进行训练。目前了解到的数据集规模相对较小，参数量级大约在10B以内，且复现过程中的技术细节较多，耗时较长。

Q：按照预期，要达到当前技术水平，大约需要多久的时间？

A：按照当前的进展速度，预计需要一年左右的时间才能在这一领域达到当前技术水平，类似于当年追赶语言模型3.5的进度。不过，如果能借鉴开源模型和不断的技术迭代，可能会缩短进程。

Q：作为视频编辑软件，快手和抖音等公司如何接入和应用新模型技术？

A：视频编辑软件首先会接入已成熟的功能模块，如特效和纹身视频功能。而对于像TTV这样的新技术，虽然直接使用有一定难度，但可以通过一些技术手段来实现类似效果。这些软件会逐步引入这些功能，并在模型效果出来后更新至更先进的模型上。

Q：如何判断互联网公司在AI领域的投入情况以及激励机制？

A：可以从组织架构、投入团队人数以及相关芯片资源等方面来判断。例如，百度在AI领域投入较多，拥有模型中台和产品中台，分别负责技术研究和产品应用。其中，模型中台团队人数超过四五百人，投入了大量算法工程人员和芯片资源进行模型训练。

Q：快手在大模型方向上的投入情况如何？阿里在大模型方面的投入和团队规模如何？

A：快手这边在大模型方向上投入了一个技术团队大概一百多个人，产品团队大概只有六七十个人，主要负责大模型产品的应用与现有产品的结合。阿里投入的技术和产品团队加起来大概有三百多个人左右，相对投入较大的是百度和质检这边。

Q：百度在算力和能力投入方面的情况如何？

A：百度在算力投入方面没有志玲那么大，但整体算力投入已达到3PBE左右。人力成本和算力投入都比较大。

Q：腾讯在AI基础模型研发方面的情况如何？

A：腾讯主要在做偏AI的基础模型研发，基于会员模型，并由高级别的首席科学家负责，投入算力在2到3万张左右，算法人员投入大概一百多个人，产品团队规模大约五六十人。

Q：大厂在推自己的AI产品时是否有预算？预算通常由谁申请？

A：预算通常由集团层面决策，不归AI部门所有。新产品的用户增长费用，如广告费用和用户增长补贴，可能来自公司内部。

Q：腾讯、百度和字节在新产品投入上是否有差别？

A：腾讯和阿里在新产品投入上相对较少，重点在模型研发；而字节在新产品投入上可能更大，尤其在抖音平台，如文心一言和豆包等产品的投入较大。

Q：通义和腾讯在集团层面是否有专门针对营销券的产品方向规划？芯片采购决策体系中，不同互联网公司之间的强势程度是否存在差异？例如阿里云和达摩院之间的差距？

A：从我的感受来看，通义和腾讯目前还没有在集团层面重点发展针对营销券的产品方向。是的，不同公司对此决策的强势程度会有差异。比如，阿里云在芯片采购方面相对强势，而达摩院作为研发型团队，其决策层更多关注模型项目的优化和调优，对于芯片采购的实际执行更多依赖工程团队来负责评测、性能优化以及采买流程。

Q：芯片采购的流程一般是怎样的？

A：芯片采购流程通常包括测试评估性能、生成评估报告、成本预算评估，然后上升至负责大模型方向的高级领导进行决策。例如，在腾讯，可能需要到副总裁级别才能拍板决定。

Q：云计算团队对大模型的影响力有多大？能否比较一下哪些公司在云厂商方面更强势一些？

A：云计算团队对大模型的影响力与该公司云发展状况相关。若公司云业务市场占有率高，则其云计算团队相对强势。比如，阿里云因其在业内市场占有率高，在这方面比通义千问更具影响力。百度云由于其整体业务覆盖更多模型算法与产品，相对于其他云计算团队也更为强势。

Q：海外互联网巨头中，华人的占比及哪些公司在海外拥有相对成熟的团队和获取信息速度较快？

A：海外著名实验室如谷歌、OKR和META的AI团队中，都有相当比例的华人背景研究人员。华人圈子在这些AI领域中扮演着重要角色。目前，大厂如谷歌、OKR和Meta投入较大，微软也在自建AI团队，投入在增加。而创业型公司在人力投入上相对较少，但也有通过较少人才实现出色产品的例子。在国内互联网大厂中，字节跳动在海外的研究工作室规模最大，而百度在海外有IDL深度学习研究院，规模较小，阿里和腾讯在海外AI研发相对较少。

Q：在互联网大厂中，您认为在吸引人才方面，薪酬是一个重要的参考因素吗？哪些公司在吸引顶级AI人才方面更具竞争力？

A：目前来看，像百度、字节跳动、阿里和腾讯等互联网大厂在吸引人才时，薪酬是一个重要的考量因素。以校招为例，一般情况下，这些公司给出的薪资水平在50万左右，但各家略有不同。比如，百度在50万左右，阿里和腾讯则可能更低一些。在特殊offer方面，各家都有自己的优势，比如阿里新计划的入职门槛和薪酬都比较高，起步级别为P7级别，并且SSP（超级时代上）offer的税前薪资可能达到八九十万。但整体来说，从薪资水平上看，对于特殊offer，差距可能不大，关键取决于工作职责、背景经验和匹配程度。

Q：海外对于AI人才的竞争情况如何？

A：海外市场上，顶尖AI人才的薪酬相对较高，比如一些核心员工的薪酬可能达到100万美刀以上。对于一般的AI人才，尤其是社招人员，薪资大约在30到50万美金之间。像硅谷、谷歌实验室和Matter实验室等在AI方向表现突出的城市，给付薪酬也相对较高，竞争更为激烈。而对于优秀人才，无论是在国内还是国外，100万以上的薪酬水平都是有竞争力的。

Q：国内AI巨头对创业公司的态度是什么？云厂商是否通过投资AI创业公司来获取算力控制权？

A：国内AI巨头对创业公司的态度相对开放，许多云计算厂商如百度云、阿里云等都与AI创业公司合作，提供离线训练服务并收取费用，同时允许创业公司使用云厂商的模型训练平台和接口，创业公司可直接调用云厂商的接口进行推理服务。在合作模式下，云厂商投资AI公司，AI公司将这笔资金用于模型训练，最终云厂商通过比例分成获得收益。对于创业型公司来说，这种方式既能获得资金支持，又能借助云厂商的算力资源，形成共赢局面。同时，如果创业公司需要独立发展产品，也可能选择单独部署机器和构建在线处理服务。目前，第一种离线训练和推理端合作模式更为广泛，百度、阿里等大厂都在采用这种模式。

Q：当大家的模型水平都达到4时，站在互联网的角度，您认为是否会出现大规模推动模型的应用？

A：如果大家的模型水平都达到4，整个市场的应用会开始大规模卷起来，包括C端产品和B端服务。C端产品会因为竞争激烈而快速发展，各家公司推出不同产品吸引用户；而在B端，由于各家公司都在做偏通用型的模型，未来可能会出现价格战和服务竞争。

Q：模型发展将如何从公用、通用转向定制化和私有化？

A：随着整体模型水平提高，市场会逐步从公用、通用模型转向更偏向垂类或特定方向使用的模型。合作模式也会从更通用的转向更定制化、私有化的合作方式，以满足客户个性化需求。

Q：创业型公司在模型生态中如何与云厂商结合以提高服务稳定性和流量变现能力？

A：创业型公司若想构建在线推理服务或仅提供B端服务，成本较高且不划算。因此，他们通常选择与云厂商结合，利用其稳定的服务和流量资源进行变现。

Q：如果所有公司都达到4.0水平，市场是否会出现内卷现象，以及未来是否会形成头部公司占据大部分市场份额的情况？

A：虽然理论上大家都达到4.0水平，但实际操作中会有高有低。不同公司在不同方向上的模型效果差异会导致差异化竞争，可能一两家公司率先达到高水平，快速占领市场，形成较大市场份额，并通过逻辑效果提升用户粘性。

Q：目前来看，Kimi对互联网大厂决策层是否有明显的引导作用，促使他们进一步扩张？

A：Kimi的存在对大厂有一定的压力，促使他们在模型结构上进行改进，以提高模型效果和竞争力。如果Kimi在技术上取得优势并扩大市场份额，将对后来者形成较大压力，各家公司因此对模型领域投入加大，以保持增长步伐。