ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验

珠江路在线   2024年4月12日  【 转载 】单职业传奇网 

  本文标签:AMD,显卡,AI

一、ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验

ROCm:一个可移植、高性能的GPU计算平台

随着AI时代的 降临,显卡的作用不再仅仅只局限于游戏,特殊是在Stable Diffusion火爆全网之后,越来越多的发烧友将显卡当成AIGC生产力工具 。

只是,Stable Diffusion的早期版本对AMD显卡 支撑不太 友爱,给大家造成了惟独N卡才 合适玩AI的错觉 。

可能众多同学不晓得的是,AMD的Radeon GPU也是 能够做深度学习的,并且性能也并不差 。

上一年12月份,AMD推出的ROCm 6.0开发平台进一步优化了RX 7000系列显卡的AI性能,特殊是Stable Diffusion的出图效率更是 获得了翻倍 晋升 。

这里先解释一下什么是AMD ROCm!

ROCm (Radeon Open Compute Platform )是 AMD 基于开源项 目标 GPU计算生态系统, 类似于 NVIDIA 的 CUDA 。

ROCm 支撑多种编程语言、编译器、库和工具,以加快科学计算、自动驾驶、人工智能和机器学习等领域的 利用 。

ROCm还 支撑多种加快器厂商和架构,提供了开放的可移植性和互操作性 。

当前深度学习开发普通都是 使用Python的,而大数据平台一般都会部署在Linux操作系统之上, 因而,AMD ROCm当前重要精力放在Linux系统上,Windows端则还有待完善 。

得益于双发射设计的流 解决器单元,RX 7900 XT仅凭5376个流 解决器就达到了55.4TFOPS的单精度浮点运算性能,而 占有10240个流 解决器的RTX 4080 Super浮点性能同样也是55TFOPS 。

至于RX 7900 XTX,其单精度浮点性能则接近60TFOPS 。

Stable Diffusion重要依赖GPU的单精度浮点性能以及显存容量与带宽,这两方面RX 7900 XT都不逊于RTX 4080 SUPER,甚至显存容量还更大一些 。

现在有了AMD ROCm 6.0的加持,终于 能够 施展出这张顶级显卡的 壮大的AI算力 。

二、Stable Diffusion出图速度对照:Linux系统下出图效率近乎翻倍

测试平台如下:

本次我们重要对照RX 7900 XT/XTX在Ubuntu与windows系统下的出图效率,看看AMD ROCm到底能带来多大 晋升 。

1、RX 7900 XT对照测试

首先是Windows 11系统, 打开Stable Diffusion之后,我们设置DPN++ 2M Karras采样、迭代步数50、Euler a采样、1024x768分辩率、CFG为7、总批次10,单批数量1 。

在Windows系统下,RX 7900 XT基于DirectML加快模式生成10张图共计耗时9分51秒,也便是591秒 。

进入Ubuntu 22.04.3 LTS系统,设置好ROCm之后,同样的参数与模型生成10张图只用掉了5分05秒,即305秒 。

对照之下,在Ubuntu 22.04.3 LTS系统下,RX 7900 XT的出图效率相比Windows系统高了足足94% 。

2、RX 7900 XTX对照测试

使用同样的参数来测试RX 7900 XTX显卡 。

在Windows系统下,RX 7900 XTX基于DirectML加快模式生成10张图总计耗时9分18秒,也便是558秒 。

进入Ubuntu 22.04.3 LTS系统,设置好ROCm之后,同样的参数与模型生成10张图只用掉了4分45秒,即285秒 。

在Ubuntu 22.04.3 LTS系统下,RX 7900 XTX的出图效率相比Windows系统率先了96%,也便是近乎翻倍的性能 晋升 。

三、小结:高性价比的AIGC显卡

当前一张非公RX 7900 XT报价在5299元左右,对位的非公RTX 4080 Super报价则是8599元,N卡贵了60% 。其 着实游戏性能方面,这两款显卡并没有太大差距 。

现在AMD也意识到了AI 利用关于GPU的重要性,加大了对AMD ROCm平台的投入, 通过不停的更新,如今AMD ROCm 6.0在AI算力方面的 晋升早已超出了大多数发烧友的预知 。

在我们的测试中,RX 7900 XT在Linux系统下 使用Stable Diffusion ROCm 6.0版时,其出图效率 几乎是Windows系统的2倍 。再外加55TFOPS的单精度浮点运算性能以及20GB GDDR6X超大容量显存,关于有较高专业AIGC 利用需要的专业消费者而言,在有限的 估算下,RX 7900 XT 能够说是十分 合适的 取舍 。

固然,也 指望AMD 能够 接续优化ROCm在Windows系统下的性能 体现,让更多的AMD消费者能 占有自己的高性价比AIGC显卡 。

免责声明:凡标注转载/编译字样内容并非本站原创,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。