一鸣惊人!Recraft v3.0横空出世!评分超越Flux与MJ,转为设计而生

一鸣惊人!Recraft v3.0横空出世!评分超越Flux与MJ,转为设计而生
2024年11月04日 11:54 优设AIGC

大家好,我是花生~

上周,知名 AI 模型基准测试平台 Artificial Analysis 的文生图榜单里,突然多了一个名为 “red_panda” 的新模型,并且力压 FLUX1.1 Pro、FLUX.1 Pro、Ideogram v2、Midjourney v6.1 和新出的 SD 3.5 Large 等一众模型,直接空降在了第一名的位置。

消息传开后很快引起了人们的关注,大家都在猜测这个模型的真身是什么,有人猜是即将到来的 Midjourney v7,也有人说是 OpenAI 的 DALL·E 4,毕竟它最喜欢突然整个大活了(比如 Sora)。最后是 10 月 31 号一家名为 Recraft 的公司在 Twitter 上发文认领了该模型,表示 red_panda 就是自家最新训练的 Recraft v3 模型。

可能大部分人都不知道这家公司,但关注我文章的小伙伴肯定对 Recraft 这个名字有印象。早在去年 6 月份,我就向大家推荐过 Recraft 这款工具,因为它是当时唯一一款可以通过文本生成矢量图像的商业 AI 工具(好像到目前为止也依旧是),后来又再次推荐了它的位图矢量化功能,非常好用。

过去的一年半时间里,Recraft 一直都没有什么大的动作,可以说是纯纯的小透明。我之前一直都希望它能继续在文生矢量图这个赛道上深耕,这样我们就能更方便地获得高质量的可编辑图像。所以在知道 red_panda 是 Recraft 的新模型时,我还是挺惊喜的,没想到向来默默无闻的它可以一下发布这么强大的模型。

而且 Recraft 官方直言 v3 是 “一款以设计语言思考的人工智能模型”,这就让我更感兴趣了,下面就一起来看看这款 v3 模型是如何 “以设计语言思考” 的吧~

一、强大的基础模型能力

做为一款文生图大模型,Recraft v3 的基础能力非常扎实,这点在前面的 ELO 评分上有直观体现。官方表示 v3 的主要优势有 4 点,分别是强大的文本渲染能力、正确的人体比例呈现、准确的提示词理解和极高的风格审美水平。

① 文本渲染能力

Recraft v3 可以正确渲染出超长、且排版合理的英文文本内容,虽然官方说它是 “世界上唯一可以生成带有长文本图像的模型”,但其实之前的 Ideogram v2.0 和 Flux.1 也可以生成长文本内容。所以这一点暂时不做评价,反正对用户来说带这种功能的模型自然是越多越好。

提示词:A robot holding chalk looking at a blackboard that reads the following poem:"ln pixels’ dance, AI’s craft will rise, Transforming visions through machine eyes, From dreams to screens, new worlds unfurled, AI’s brush reshapes our visual world."

② 正确的人体结构生成

无法正确生成人的手指、脚趾细节,以及人物肢体动作容易发生扭曲变形,是 AI 出图一直都存在的问题。Recraft 则表示经过专门训练后,v3 模型可以保证这些人体结构正确生成,同时在场景的空间连贯性、以及背景相对主体的自然定位上有优秀表现。

我还拿之前常用的几组提示词是试了一下,从结果来看 Recraft 在手指等细节上的表现的确不错,比 flux.1 Pro 都好,并且在动态上更多样、自然。

③ 准确的提示词理解

Recraft v3 可以准确理解复杂的提示词,正确生成提示中包含的物体数量、颜色和位置。我用官方给的示例提示词,分别在 MJ、Flux.1 Pro 和 SD 3.5 Large 中测试了一下,结果三家生成的图像都没有准确反映出提示词的内容,由此看见 Recraft v3 在这一点上的确很强。

④ 风格审美

在图像美学水平上,Midjourney 是目前毋庸置疑的第一,Recraft 见贤思齐也在这一方面做了专门的训练。

其实在前面的对比图中也能看出来,它的美学质感并不输 MJ 的,并且明显优于 SD 3.5 和 Flux.1 Pro。尤其是在进入 Recraft 的 Community 社区时,真的有眼前一亮又一亮的感觉,不仅图像风格多样,而且每一张的质感都很好,让人忍不住细细观赏,感觉 Midjourney 真的有对手了。

Recraft Community 直达:recraft.ai/community

二、专为设计而生的 4 大功能

在提升模型基础生成能力之外,Recraft 也深知对实际的图形设计任务来说,只有高质量的图像是远远不够的,用户更需要有足够多的控制手段,来精准实现自己的想法。因此 v3 模型在经过训练后,可以提供比其他模型更丰富的图像控制功能,包括定位排版设计、风格训练迁移、矢量图像生成和 AI 样机功能。

① 定位排版设计

Recraft v3 可以根据用户提供的参考图,生成相似构图的新图像,也就是既 SD-Controlnet 和 Midjourney-Retexture 后,我们又有了一个新的支持精准控制的文生图工具。

这个功能在 Refcraft 中称为 Frame。选中该模式后,你可以新建画布添加文字排版,或直接上传设计稿,然后填写关键词,设置控制强度、配色主题,最后点击生成。经过测试,我觉得虽然该功能在风格质感上虽然略逊于 MJ,但在操作便捷性和控制效果上还是非常给力的。

② 风格训练迁移

该功能类似于 Midjourney 的 Style Reference 风格参考功能,用户可以上传 5 张图像,训练为一个简易版的 Lora 并储存。之后再生成图像时,可以选择这个自定义风格实现准确一致的风格应用效果。

下面是前期训练风格阶段的界面截图,我上传的是 5 张用 Midjourney 生成的图像。从测试结果来看,风格延展地非常不错,操作也很简单,这为解决 Recraft 风格不够多样提供了一个新的思路。

③ 矢量图像生成

升级后的 Recraft 并没有丢弃它原有的矢量图像生成、编辑功能,这非常棒。它支持的操作包括:

  1. 直接通过文本生成不同风格的矢量文字、图形内容,并支持一键切换不同的上色效果;
  2. 将 AI 生成或用户上传的图像转为矢量可编辑格式;
  3. 支持导出为 SVG 格式,可以继续在 Adobe Illustrator 等软件中编辑。

支持矢量编辑对设计师和插画师来说有多重要无需赘述,究竟有多好用大家自己去操作一下就知道了。

④ AI 样机功能

套样机是设计里最常见的操作之一,所以 Recraft 也很贴心的把这一项的功能加上去了。

我们可以直接通过 v3 模型生成经典样机模板,包括模特、衣服、杯子、书籍、电子产品等; 然后再生成或上传设计稿,比如 Logo、图标、插画、文字等,接着你就可以随意调整设计稿在样机上的摆放位置及大小,Recraft 会自动实现完美融合,然后再一键导出为成品图。

三、Recraft 使用简介

官方操作界面直达:https://www.recraft.ai/invite/7gqb7GkOwN

Recraft 目前可免费试用,新用户每天有 50 个免费积分,生成一张图像扣除一个积分,额度还是比较充足的。

虽然模型全面升级了,Recraft 依旧沿用了无限画布式的操作界面。使用时,需要先新建一个 Project 项目,然后在空白画布的任意位置新建一个或多个画板,进行图像的生成、修改、编辑等操作。

Recraft 还提供了一整套完整的图像编辑功能,帮助用户更好地进行设计工作。传统的有图层管理、色彩调整、画笔、文本输入等;AI 方面有局部重绘、内容消除、高清放大、生成变体、位图矢量化、背景扣除、背景重新生成等。一些简单的封面、banner 设计工作可以直接在其中完成,无需借助其他工具。

篇幅所限我就在本篇内介绍详细的操作教程了,AI 工具的用法都很简单,官方也提供了详细的操作指引,相信你一看就会;如果需要的话可以在评论区留言,人多的话我会考虑出一篇详细用法/技巧介绍。

虽然 Recraft v3 模型在实测中并没有到全面超越现有模型,但是它在基础性能、审美质感上已经超越 Flux.1 和 SD 3.5,可以与 Midjourney v6.1 一较高下;而它基于设计思维构建、聚合的一系列功能,更是独此一家别无分店,的确是更适合处理设计任务的 AI 工具,非常推荐设计师、插画师都去体验一下。

那么以上就是本期推荐的内容,喜欢的话记得点赞收藏支持一波,我会更有动力为大家推荐新的 AI 干货。如果你还不了解 AI 绘画的相关内容,可以看看我的课程《零基础 AI 绘画入门指南》。这是一门面向 AI 绘画零基础人群的系统课程,有全面细致的用法教学,并提供配套资源,能帮你快速掌握 Midjourney 和 Stable Diffusion 这两款目前最热门的 AI 绘画工具。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部