美图陈剑毅:AIGC让中国科技公司在影像生产力领域迎来新机|融中对话

美图陈剑毅:AIGC让中国科技公司在影像生产力领域迎来新机|融中对话
2023年10月01日 13:02 融资中国

引人注目的是,得益于AIGC技术的发展,美图公司的七款产品已经全部面向生产力场景。

本文3238字,约4.6分钟

作者 | 曹天鹏  编辑 | 吾人

来源 | 融中财经

今年,美图公司加大研发投入,通过AI生成内容(AIGC)引擎推动更多应用场景落地。

就在6月下旬,美图公司举办以“AI时代的影像生产力工具”为主题的第二届影像节,一口气发布7款新品:AI视觉创作工具WHEE、AI口播视频工具开拍、桌面端AI视频编辑工具WinkStudio、主打AI商业设计的美图设计室2.0、AI数字人生成工具DreamAvatar、美图AI助手RoboNeo、自研AI视觉大模型MiracleVision,形成由底层、中间层和应用层构建的AI产品生态。

其中,自研AI视觉大模型MiracleVision,定位于”懂美学”,从视觉创作场景反推技术演化,挖掘视觉创作中,合适与AI协作的场景,例如绘画、设计、影视、摄影、游戏、3D、动漫等视觉创作场景。

引人注目的是,得益于AIGC技术的发展,美图公司的七款产品已经全部面向生产力场景。这表明,美图公司正逐渐加大对生产力场景的投入和重视。美图公司创始人、董事长兼首席执行官吴欣鸿提到,美图要将工具的价值从生活场景切入到生产力场景。

在美图公司集团高级副总裁、影像产业事业群总裁陈剑毅看来,随着科技的持续创新,中国科技公司在影像生产力领域迎来新机会。

过去一些影像效果需要几个月的研发,如今因为AI的到来,短短几周就能实现。“我们对于AI可以用全情投入来形容。这是件非常令人兴奋的事情。”

以下为本刊采访内容,以飨读者:

本刊:感觉外界对于大模型的应用场景都大差不差,那么未来竞争壁垒在哪里?

陈剑毅:在我的视角看来,我总结两个点,一是我们团队对于美学的执着,第二个是我们积累了十几年的用户的基础。

我们对美学有很强的追求,是美图做自研大模型的一个很重要的优势,我们的团队是一群特别热爱影像、特别懂美学的人所组成的,我觉得是很关键的一个壁垒。

二是用户规模,美图有上亿的月活用户,深度理解用户的审美趋势和需求,能将这个美学理解应用于大模型迭代,这个是整个大模型成长过程中非常关键的一个点。

所以,大家看到美图大模型在美图的产品里面去应用,美图每月有约2.5亿月活跃用户,不断地去用我们的效果,不断地去帮我们去矫正自己一个模型的一些参数。比如当它应用的一个效果,我们就大概知道它对于这个模型的效果是不是喜欢从而不断地去调教,所以其实我们做这个模型它的成长速度,是会远比其他没有这种用户规模的产品更有优势。

本刊:哪些是需要在AI技术变革浪潮当中改变的?

陈剑毅:在过去,美图积累了大量的算法和能力,这些算法和能力在AI技术生成的浪潮中值得被重新构建和优化。例如,在人物美颜方面,通过AI技术可以使得效果更加自然,风格更加多样。为了实现这一点,团队需要寻找数百种不同的素材,并通过识别来观察大部分的概率,以及如何与用户的人脸更好地融合。大部分都是这样的思路,用重构去看待。

本刊:美图设计室这一块,现在已经更新到2.0版本了,其中有一个功能叫做AI商品图,它怎么动态展现这些模特或者上身的这种效果,现在大概是应用到怎么样的阶段,有没有相关的商家案例的合作?

陈剑毅:美图设计室已为近百万中小电商卖家提供AI商拍服务。目前有跟几家大的客户电商平台在谈一些具体的API合作,会接入他们整个一个电商平台的SaaS的后端,他们的商家通过SaaS就可以在我们的接口,用手机或者用设备简单拍摄这个商品,通过我们的AI的接口一键去生成一整套的商品图,这个是目前已经有行业在应用。

在效果上如果要把商品或者商品图模特做得特别深入,其实挑战还是蛮大的,说实话这个东西从技术的门槛而言,它的门槛可能不是特别高。如果大家平常刷社交平台比较多的话,会发现很多的创作者在社交平台上面已经实现了这样的一个效果,更多是用自己所部署的模型去实现的。

但是我们在把这东西去做产品化的时候发现,你真的想把这些东西调好,需要针对不同的场景做很多适配,并且需要很长的效果调教时间后,AI才能够根据需求生成模特试穿、试戴商品的效果。

本刊:看到去年Wink的数据很不错,今年推出的桌面版WinkStudio是原来的加强版吗?这个产品推出的策略基于怎样的考虑?

陈剑毅:除了之前提到的那些痛点,我们还收到了大量来自专业视频创作者的反馈。他们普遍反映,希望我们能推出桌面版的Wink,因为他们在使用电脑进行视频处理前,还需要将视频导入手机先处理一遍,再保存导入到电脑,这个流程对于创作者来说太耗时了。并且我们也收到很多Wink手机端用户的反馈,他们强烈要求我们尽快开发桌面版Wink,并表示一旦推出,他们会立即升级为付费用户。

正是基于这些用户需求和行业调研,我们决定开发Wink桌面版,更好跟市面上已有的工具互补共生。我们借助AI能力重新去审视整个视频工作流里面有哪些可以被革新的环节,有哪些真正可以提升效率的,像设计工具其实都是一次重新定义的机会。目前,WinkStudio获得了上万名视频创作者的认可。

本刊:对于美图而言,训练出这样一个大模型可能会遇到哪些困难,如何克服的?

陈剑毅:得分场景去考虑。如果想要建立一个通用的模型,很容易能够生成各种效果,但这样容易导致模型生成的画质降低或者效果品质不好。因此,需要针对不同的应用场景和需求,进行具体的筛选和优化。例如,在国风国潮领域,可以从几千个品类中挑选出3个重要的类目,并针对这些类目进行效果的开发和调试。在生成效果时,还需要不断进行开发和优化,制定细分的规则,以确保生成的效果符合需求并能够获得商业上的成功。

本刊:现在开始全面进入生产力市场,针对生产力场景业务发布7个产品,是不是意味着我们生活场景和生产力场景两条腿走路,以及我们后续在生产力场景市场还有哪些领域想要涉及?

陈剑毅:从生活场景到生产阿里场景,影像技术底层是共通的,但应用场景和需求却有很大的差异。例如,抠图功能在生活场景主要应用于生活照的处理,而在生产力场景则可以应用于商品图的生成和物料制作。虽然技术底层相同,但在场景使用上面完全不一样。

因此,从生活场景到生产力场景这个事情看起来做容易,但具体应用场景和需求上需要进行精细化的适配。对于美图而言,过去15年在生活场景的积累已经相当丰富,产品在全中国具有广泛的知名度和用户基础。然而,生活场景产品的增长已经处于稳定状态,而生产力场景市场则具有更大的发展空间。

如果能够将过去在生活场景的积累,包括产品理念、方法论等,应用到生产力场景,将有助于美图在生产力场景市场的发展。生产力场景产品需要更加具体的场景和客户团队,销售和客户的方法也不同。对于美图来说,这是未来十年特别重要的发展方向,也是团队感到兴奋和有干劲的领域。

本刊:关于主要为VIP订阅的影像设计产品业务收入,2023年上半年营收同比增长62.2%,想问一下这个成就是怎么做到?有没有什么可以分享自己内部做得对的事情?

陈剑毅:关于设定目标的问题,我们发现,虽然商业目标可以通过数据推导和策略实现,但对于非商业目标,如用户活跃度等,我们不再设定具体的数字目标,而是更加关注实际的服务用户和满足他们的需求。过去,当我们设定月活跃用户数增长至一定数目时,几乎从未实现过这一目标。这种情况下,月活跃用户数目标似乎成了一种“魔咒”。

近年来,我们在制定产品策略时,不再过于追求短期内的商业利益,而是更加注重是否真正地满足了用户的需求,帮助他们实现目标。例如,我们的设计工具是否真正提高了淘宝商家的工作效率,帮助他们赚取更多的利润。这种以用户为中心的方法为我们带来了更好的成就感,而不是仅仅追求冰冷的数字目标。

在开发VIP功能时,我们需要在产品与商业之间找到一个平衡点。我们不能简单地将原本免费的大众功能转化为收费项目,否则可能会导致用户的不满和流失。相反,我们需要寻找具有小众性和刚性需求的功能,如针对发际线较高人群的发际线修补功能。这类功能虽然覆盖的用户群体较小,但对于特定用户而言,其痛点程度足以让他们愿意每月支付10元购买会员。

此外,我们还将这一原则应用于其他VIP功能的设计,如美颜相机中的提词器功能。该功能主要面向专业博主,他们通过拍摄短视频来吸引粉丝和实现盈利。这些用户发现提示器功能能够有效提高涨粉和变现的效率,因此愿意付费开通会员。

总之,我们将这一理念贯穿于所有VIP功能的设计中,以确保我们的产品既能满足用户的需求,又能带来良好的商业收益。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部