RTX 40 系列GPU算力奠基,PC迎来AI生产力进化革命

RTX 40 系列GPU算力奠基,PC迎来AI生产力进化革命
2024年04月29日 10:39 微型计算机官方微博

2024年4月19日,NVIDIA在北京举办了一场关于AI生产力的RTX AI媒体品鉴会。在本次媒体品鉴会上,NVIDIA宣布了大量AI创作及应用层面的技术、产品及资讯更新:包括NVIDIA与火星时代教育联合发布《NVIDIA TensorRT Stable Diffusion创作加速指南》和使用案例;NVIDIA与吐司/Tensor.Art联合发布《个人用户玩转Stable Diffusion 的GPU配置推荐》,聚焦SD 1.5 和SDXL 1.0,全面测试RTX 40系显卡和笔记本电脑GPU在Stable Diffusion推理和LoRA模型训练的表现,全面评估RTX40系显卡的Stable Diffusion性能;在智谱AI端云一体大模型解决方案中,NVIDIA TensorRT-LLM 助力智谱AI ChatGLM 模型推理加速。此外,现场还有大量展示Demo,如NVIDIA ACE、ChatRTX、Stable Diffusion、DLSS 3.5、NVIDIA app以及来自土豆人tudou_man、Simon阿文、海辛、言萧等AI艺术家基于RTX 40系列AI PC创作的AIGC作品。

不夸张地说,这称得上是一场关于AI生产力探讨的超级盛宴,也是为AI PC赋能的宏大宣言。下面就跟随《微型计算机》记者的步伐,一起来看看NVIDIA在AI PC领域内的“宏图大志”。

RTX GPU带来AI应用的全面进化和升级

从2007年CUDA的面世带来了图形渲染和通用计算的统一,到2018年RTX GPU登场提出神经网络渲染的宏大目标,这十年时间可以看作是NVIDIA GPU和生态针对AI计算加速的萌芽发展期。

随后在2023年,随着各种生成式AI的应用落地,正式宣告AI PC时代已经来临。

看得出,在很早之前NVIDIA就已经布局GPU的未来发展规划,而这些年来我们也切实看到了NVIDIA GPU一步步正加速向 AI 计算强化的转变。在以前,我们经常将电脑根据应用场景而区分为家用、办公、设计创作以及游戏等各种类型,但在今后,这些被人为划分的电脑类型很可能被一个统一的称呼所代替,这就是AI PC。

AI PC这个概念很好理解,顾名思义,AI PC就是搭载了能够针对AI计算进行加速的电脑。对NVIDIA来说,RTX GPU目前就是最核心的AI计算加速硬件,而其中的AI加速器就是我们非常熟悉的张量核心Tensor Core。正是由于Tensor Core的加入,使得RTX GPU拥有了显著加速AI计算的性能,更重要的是,它为PC用户带来了之前只能在云端的大型计算服务器上才能运行的诸多新特性和新功能。

衡量 AI 处理性能的一种方法是以 TeraOPS 为单位的AI算力。TeraOPS 即“万亿次运算/秒”(TOPS),TOPS 可作为单一指标让用户了解 PC 的 AI硬件处理能力,GeForce RTX 40系列GPU可提供的算力涵盖从194 AI TOPS到1300 AI TOPS,包括笔记本电脑和台式电脑的多样选择。与之相比,目前没有独立 GPU 的轻量级 AI PC 的算力仅为 10 至 45 TOPS。而在 PC上本地运行AI应用也有诸多好处:在 GeForce RTX PC 系统上运行,速度很快同时用户的数据保存在本地。用户可以在本地 PC 上处理敏感数据,因此无需与第三方共享数据或连接互联网。RTX AI PC目前已成为拥有超过 1 亿用户量和 超过500 款RTX AI 应用与游戏的生态。

所以,另一个概念——RTX AI也就很好理解了,它显然就是说配置了RTX GPU的AI PC所能呈现出的AI计算加速功能与性能的应用特质。在本次媒体品鉴会上,NVIDIA也是联合业界诸多知名创作者和公司,为与会媒体展现了RTX AI在AI PC时代的推动力。从游戏产业到设计创作领域,RTX GPU加速的AI应用可谓无所不在。

RTX AI与游戏DLSS 3.5图像帧率双加速

DLSS技术伴随RTX GPU面世,凭借独特的Tensor Core,利用AI计算和云端模型训练为游戏带来了卓越的帧率提升和图像质量改善的双重“Buff”。在DLSS 2.x时代的超级分辨率、DLSS 3时代的“帧生成”之后,DLSS 3.5的面世又带来了全新的光线重建Ray Reconstruction技术,通过基于Tensor Core 加速的AI模型增强光追游戏的画质表现,实现了画质和性能的再次提升,为玩家带来了最极致的光追游戏体验。而这也是RTX AI在游戏领域内应用的一大亮点。

▲NVIDIA在现场演示基于RTX Remix重制的《传送门》RTX版, NVIDIA RTX Remix可让 Modder 轻松截取游戏素材,使用生成式 AI 工具自动增强材质,以及借助全景光线追踪和 DLSS 快速创建令人惊艳的 RTX 重制版游戏。在现场演示中可以看到,在开启DLSS 3.5之后,游戏环境的光追效果表现更加突出,细节更清晰,游戏画质得到了极大的提升。

RTX AI与游戏ACE带来栩栩如生的NPC互动

在2024 CES大会上,NVIDIA正式推出了NVIDIA ACE(Avatar Cloud Engine)这一基于云和AI的微服务。NVIDIA ACE (Avatar Cloud Engine) 是一套可帮助开发者利用生成式 AI 创建栩栩如生的虚拟数字人物的技术。在 ACE 的加持下,普通的非玩家角色 (NPC) 可以摇身一变,成为能够发起对话或引导玩家找到新任务的动态交互式角色。

在 CES 2024 上,NVIDIA推出适用于 NVIDIA Audio2Face (A2F) 和 NVIDIA Riva 自动语音识别 (ASR) 的 ACE Production Microservices,并且表示正在与杰出的虚拟数字人物开发者合作,致力于将 NVIDIA ACE 技术呈现给游戏玩家。

Covert Protocol 是Inworld公司与NVIDIA合作开发的一项全新技术Demo,它突破了游戏中角色互动的界限。Inworld AI 引擎集成NVIDIA Riva 和NVIDIA Audio2Face,前者可实现精确的语音转换文字,后者可提供逼真的面部表情。Inworld AI引擎采用多模态方法来展示非玩家角色(NPC),将认知、感知和行为系统集成在一起,在精心制作的环境中呈现令人惊叹的 RTX 渲染角色,以实现身临其境的叙事效果。在本次媒体品鉴会上,NVIDIA也展示了基于Inworld AI引擎制作的游戏Demo。

NVIDIA在现场演示基于ACE制作的游戏互动NPC。在这个演示Demo中,玩家将通过与三个关键NPC的对话来找到通关所需线索。游戏采用麦克风输入语音对话,再经由Audio-to-Text转换为文本并送到云端的推理服务器进行计算,再将计算结果经过Text-to-Audio转换为语音,并在本地经过Audio-to-Face计算生成NPC的实时对话口型和表情。这也是NVIDIA ACE微服务运作的基本原理,其中的核心在于RTX 4090 D GPU的Tensor Core的AI计算加速能力和与云端大模型推理相结合的混合AI能力。

▲与会媒体在品鉴会上体验基于ACE的智能NPC演示Demo

RTX AI与设计创作

基于TensorRT的Stable Diffusion AIGC加速

NVIDIA TensorRT软件开发者套件可加速深度学习推理性能。TensorRT 能加速非常热门的生成式 AI 模型,如 Stable Diffusion 1.5和 SDXL等。全新的 UL Procyon AI 图像生成基准测试现已支持 TensorRT 加速,内部测试表明该基准测试可以比较准确地反映目前的实际性能表现。将 Tensor Core 与 TensorRT 结合后,本地RTX AI PC 可获得卓越的生成式 AI 性能。

作为当前消费级市场上最快的Stable Diffusion 计算出图方案,RTX 4090 D GPU能做到每秒8张图的生成速度。搭配TensorRT,再配合开发者进一步的性能优化,目前RTX 4090 D GPU最高能实现超过每秒120张图的生成速度,Stable Diffusion用户也能像游戏玩家一样通过高帧率享受丝滑的创作体验。

在媒体品鉴会上,我们也体验了基于开源InstantID模型和工作流的AI证件照Demo。它能够通过普通摄像头的自拍照生成影棚级的肖像照,为用户带来真正生产力级别的AI加速应用体验。《微型计算机》记者也在现场亲自体验了一下,效果确实“杠杠的”。

同时,在本次媒体品鉴会上,也有诸多业界知名机构和从业者带来了基于RTX 40系列GPU的AIGC成功应用分享及心得体会。

业界声音:火星时代教育发布《NVIDIA TensorRT Stable Diffusion创作加速指南》

《NVIDIA TensorRT Stable Diffusion创作加速指南》

链接:https://www.hxsd.com/pdf/viewer/HXSD-NVIDIATensorRT-GuideBook/

在本次媒体品鉴会上,中国知名的数字艺术教育高端品牌火星时代教育联合NVIDIA以白皮书的形式发布了《NVIDIA TensorRT Stable Diffusion创作加速指南》。这是火星时代教育为AI设计爱好者和创作者基于RTX 40 系GPU提升Stable Diffusion创作效率的实操性教程。指南包括:安装与设置,加速引擎构建,加速效果对比以及NVIDIA TensorRT在实际商业创作场景的应用(海报设计、电商设计、室内效果图设计、插画设计),帮助使用者在创作过程中借助详细教程和加速工具实现商业创意落地,提升创作效率。指南由火星时代教育AI设计教研团队主要研发,NVIDIA 技术团队提供技术支持,未来将根据应用软件版本优化并迭代升级。

火星时代教育创始人王琦表示:“火星时代是 NVIDIA Studio 中国区生态合作伙伴,火星时代教育创始人王琦表示:“火星时代是 NVIDIA Studio 中国区生态合作伙伴,双方共同探索AI软件在设计流程中的辅助作用,并在火星影视学院部分专业引入NVIDIA Studio AI应用做教学试点,在2023年共同开发AI设计方向创作加速的公开课,此次联合发布《NVIDIA TensorRT加速Stable Diffusion创作加速指南》是火星时代和NVIDIA聚焦‘科技+教育’在设计领域的积极实践,充分激发学习者对于科技发展的关注,拥抱AI前沿技术,为个人效率加速,为商业创作赋能。”

业界声音:吐司/Tensor.Art发布《个人用户玩转Stable Diffusion 的GPU配置推荐》

作为头部AI模型平台,吐司/Tensor.Art 和NVIDIA联合发布了此次《个人用户玩转Stable Diffusion 的GPU配置推荐》。在白皮书内容中使用吐司基准测试以及第三方测试软件UL Procyon AI基准测试完整测试了NVIDIA从RTX 4060到RTX 4090D的所有显卡和笔记本电脑GPU在SD的推理和模型训练上的表现,对AIGC爱好者在后期模型训练和设备选择上都有一定的参考作用。

《个人用户玩转Stable Diffusion 的GPU配置推荐》

链接:https://tusi.cn/event/nvidia

吐司/Tensor.Art 创始人沈振宇表示:“目前吐司和Tensor.Art上已经有超过16w+的模型数量。此次与英伟达联合发布《个人用户玩转Stable Diffusion 的GPU配置推荐》旨在让关注AIGC领域的入门用户以及不同垂类场景的用户在选择RTX AI PC设备进行模型训练和应用时提供客观、公正的配置参考,提升用户使用AIGC的生产效率。”

从沈振宇在本次会上展示的白皮书部分内容来看,在UL Benchmark SD1.5 TRT vs. OpenVINO的对比测试中RTX 4090笔记本电脑GPU相对于iGPU(Arc Graphics)有超过27倍的性能提升。

业界声音:Morph Studio 的AIGC落地生活应用

Morph Studio 产品经理海辛在会上也带来了基于RTX 40 系 GPU加速的AI应用创作实例展示,主要包括恋与制作人真人转绘、AI美甲和酒单设计等。

恋与制作人真人转绘:结合本地 LoRA 训练和 IPAdapter & ControlNet 的使用搭建 ComfyUI 工作流,将二维插画一键转真人。

酒单设计:跳出传统平面设计流程,用纯AI转绘的方式来完成酒品的风格化。并结合 Layer Diffusion 模型直接产出符合城市特色的透明通道素材,极大缩短了设计流程。

AI美甲:收集大量的美甲图片,将它们作为数据集来训练一个目标AI生成模型,使其能够创造美甲设计。AI根据客户需求设计美甲,然后打印机立即将相应的图案打印到可穿戴的指甲上。通过这个项目展示了生成式AI如何能够革命化传统的工业流程。

Blender 艺术家、AI创作者Simon阿文在媒体会上也分享了自己关于利用RTX GPU加速AI创作,并将其与3D建模渲染作品相结合的创作经验。Simon阿文表示:“‘AI 如何塑造我们的工作与生活’ 这个在过去听起来是少数大公司才有资格讨论的问题,但在如今这个问题的答案由AI社区和创作者塑造。包括央视春晚AI动画等作品在内,从文字、图像到影像,我的许多探索是基于本地 RTX 4090 完成的。AIGC的可能性是一片蓝海,AI PC是我的帆船。”

RTX AI与设计创作实时3D渲染与视频创作

在设计创作领域,得益于NVIDIA Studio生态圈的多年经营,基于RTX GPU AI加速的应用可谓是已经遍地开花,也已趋于生态的成熟。无论是基于Blender、Maya、3DSMax、D5等应用的3D渲染设计,还是像剪映、Davinci Resolve、Premiere Pro等视频创作的AI加速,RTX GPU都在其中贡献了巨大的生产效率提升作用。尤其是在AI应用逐渐下沉到基础设计行业之后,生成式AI视频也得以大放异彩。当然,要进行完美、高效的生成式AI视频应用,基于RTX GPU的AI PC仍是刚需。

业界声音:即致AI建筑设计创作,所想所见即所得

在品鉴会上,国内前沿建筑设计师、艾哎集瑟科技联合创始人言萧分享了他利用即致AI进行建筑设计创作的心得。言萧表示:“作为一名经常使用AI工具的建筑师,我对RTX平台的加速优势深有体会。它极大提高了AI图形生成软件的性能,特别是如Stable Diffusion等工具,在建筑设计的方案概念阶段尤为重要。通过RTX平台,我们能够快速获得高质量的渲染图像,有效加速设计过程,增强视觉表现力,极大促进了创意的快速迭代和方案的优化。这种技术进步不仅提升了设计效率,也为建筑师提供更广阔的创作空间”。

在建筑设计领域,即致AI基于扩散模型和蒸馏技术,通过RTX GPU的加速,实现了秒级的AI实时绘画。结合即致AI自研的全网下载量超50万国内建筑行业大模型,帮助建筑设计师享受AI实时渲染划时代的快捷、便利的同时,依然可以保证极高的出图效果。笔者也在现场体验了一番即致AI,在RTX 4090 D GPU的加速计算下,真正可以实现所想即所见,对建筑设计效率有巨大的提升。

业界声音:3D建模融合生成式AI,赋予作品以灵魂

低俗小说 AI转绘:在这个项目里,阿文和海辛将《低俗小说》中著名的摇摆舞,通过AI的方式转绘为油画、皮影戏、雕塑等多个风格并进行重新剪辑,达到一种多元宇宙的视觉效果。

搁浅的云:灵感来自海辛的短篇《搁浅的云》中的一句话:我在海边遇到一朵搁浅的云。在这个作品中,Simon阿文通过 Blender 制作简模,并使用 ComfyUI 搭建工作流进行 AI 转绘,把AI渲染应用到传统的3D工作流中。

业界声音:生成式AI视频创作,真我与虚幻的思考

数字艺术家 & 策展人土豆人Tudou_Man在品鉴会上带来了基于生成式AI的创作视频产品,土豆人Tudou_Man 表示:“每天有大量AIGC内容涌现,宛如微小的青苔连续改写当下。不久,我们的文明也将被数字所覆盖。通过RTX 40系列AI PC平台的运算加持,震惊之余,我使用RTX 40系列 RTX AI PC创作了《复写苔原》系列作品,RTX 平台为像我这样的数字艺术家提供高效的AI算力加速。我将AIGC作品注入人的思考与灵魂,在不可逆的数据洪流中保持本真。”

重塑山河:通过SVD+deforum创作动态形象,更梦幻地呈现了山河之下的都城变迁,一切尘土归为轻烟。

《咖啡浪潮的1000次演进》:为2023年的上海咖啡文化周创作一件AIGC概念作品。作品以上海苏州河游船为创作原型,采用实景采集与Midjourney + Stable-Diffusion组合的方式创作,通过上千次的叠加演算,近乎真实地让浪花载着一杯巨大的外卖咖啡出现在苏州河上。

RTX AI让AI更懂你ChatRTX

ChatRTX可将包括智谱AI的ChatGLM3-6B在内的大语言模型与使用者本地的数据集链接起来,从而改变用户与自己数据之间的交互方式,且支持语音输入和图像功能。

包括ChatGLM3-6B在内的大语言模型支持TensorRT-LLM加速,且英伟达与智谱AI也宣布了两者在此方面的合作。

▲NVIDIA技术人员在会上讲解ChatRTX的优势与技术特点

业界声音:TensorRT-LLM让推理性能加速提升

智谱AI在品鉴会上也分享了关于AI 端云一体大模型解决方案的内容。智谱AI于2021年研发了GLM(General Language Model通用语言模型)(ACL'22),同时解决了语言理解(BERT)和生成(GPT)方面的挑战,让大模型适用更多任务和场景,也更适应中文语言环境。

ChatGLM是基于GLM预训练框架的双语对话模型,采用了独创的多阶段增强预训练方法,包括6B、12B、32B、66B等多种尺寸。同时ChatGLM3 支持多样的加速工具,包括NVIDIA TRT-LLM框架,使模型性能在合理的精度损失下实现推理加速提升。

智谱AI副总裁吴玮杰表示:“大模型加持的AI PC将带来生产力范式革命,让AI生产力普惠每个人。随着端侧算力和大模型能力的演进,支撑AI PC的大模型解决方案应该是端云一体的混合AI。端侧和云侧大模型无缝协同,共同为用户提供“智力”强大、随时在线、极速响应、安全可信、个性化的AI PC应用。我们的大语言模型 ChatGLM3-6B 支持 NVIDIA TensorRT-LLM 等加速框架,使模型推理性能实现加速提升,让用户在AI PC上可以获得更加流畅的体验。”

RTX火力全开,AI PC起飞指日可待

在这场品鉴会之后,我们真切地感受到了它所涵盖的丰富内容以及NVIDIA对AI PC未来发展的“梦想”。在AI逐渐接轨日常生活、工作之后,它所带来的生活质量改善与工作效率提升的效果也逐渐凸显了出来。业界全体AI化的进化方向似乎已经不可避免,尽管行业整体都在暗自发育发力,也呈现出了一点百花齐放的苗头,但目前来看地位最超然的仍然还是在此领域内耕耘许久且占据了先机的NVIDIA。基于RTX GPU的AI应用计算加速俨然已经走在了一众厂商的最前列,也得到了最广泛的应用支持。基于此,我们认为RTX AI有很大机会能掀起一场AI PC的生产力革命,并快速带动AI应用高速前行。不信?让我们拭目以待!

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部