ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验 |
珠江路在线
2024年4月12日
【
转载
】单职业传奇网
|
本文标签:AMD,显卡,AI |
一、ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验
ROCm:一个可移植、高性能的GPU计算平台
随着AI时代的 降临,显卡的作用不再仅仅只局限于游戏,特殊是在Stable Diffusion火爆全网之后,越来越多的发烧友将显卡当成AIGC生产力工具 。
只是,Stable Diffusion的早期版本对AMD显卡 支撑不太 友爱,给大家造成了惟独N卡才 合适玩AI的错觉 。
可能众多同学不晓得的是,AMD的Radeon GPU也是 能够做深度学习的,并且性能也并不差 。
上一年12月份,AMD推出的ROCm 6.0开发平台进一步优化了RX 7000系列显卡的AI性能,特殊是Stable Diffusion的出图效率更是 获得了翻倍 晋升 。
这里先解释一下什么是AMD ROCm!
ROCm (Radeon Open Compute Platform )是 AMD 基于开源项 目标 GPU计算生态系统, 类似于 NVIDIA 的 CUDA 。
ROCm 支撑多种编程语言、编译器、库和工具,以加快科学计算、自动驾驶、人工智能和机器学习等领域的 利用 。
ROCm还 支撑多种加快器厂商和架构,提供了开放的可移植性和互操作性 。
当前深度学习开发普通都是 使用Python的,而大数据平台一般都会部署在Linux操作系统之上, 因而,AMD ROCm当前重要精力放在Linux系统上,Windows端则还有待完善 。
得益于双发射设计的流 解决器单元,RX 7900 XT仅凭5376个流 解决器就达到了55.4TFOPS的单精度浮点运算性能,而 占有10240个流 解决器的RTX 4080 Super浮点性能同样也是55TFOPS 。
至于RX 7900 XTX,其单精度浮点性能则接近60TFOPS 。
Stable Diffusion重要依赖GPU的单精度浮点性能以及显存容量与带宽,这两方面RX 7900 XT都不逊于RTX 4080 SUPER,甚至显存容量还更大一些 。
现在有了AMD ROCm 6.0的加持,终于 能够 施展出这张顶级显卡的 壮大的AI算力 。
二、Stable Diffusion出图速度对照:Linux系统下出图效率近乎翻倍
测试平台如下:
本次我们重要对照RX 7900 XT/XTX在Ubuntu与windows系统下的出图效率,看看AMD ROCm到底能带来多大 晋升 。
1、RX 7900 XT对照测试
首先是Windows 11系统, 打开Stable Diffusion之后,我们设置DPN++ 2M Karras采样、迭代步数50、Euler a采样、1024x768分辩率、CFG为7、总批次10,单批数量1 。
在Windows系统下,RX 7900 XT基于DirectML加快模式生成10张图共计耗时9分51秒,也便是591秒 。
进入Ubuntu 22.04.3 LTS系统,设置好ROCm之后,同样的参数与模型生成10张图只用掉了5分05秒,即305秒 。
对照之下,在Ubuntu 22.04.3 LTS系统下,RX 7900 XT的出图效率相比Windows系统高了足足94% 。
2、RX 7900 XTX对照测试
使用同样的参数来测试RX 7900 XTX显卡 。
在Windows系统下,RX 7900 XTX基于DirectML加快模式生成10张图总计耗时9分18秒,也便是558秒 。
进入Ubuntu 22.04.3 LTS系统,设置好ROCm之后,同样的参数与模型生成10张图只用掉了4分45秒,即285秒 。
在Ubuntu 22.04.3 LTS系统下,RX 7900 XTX的出图效率相比Windows系统率先了96%,也便是近乎翻倍的性能 晋升 。
三、小结:高性价比的AIGC显卡
当前一张非公RX 7900 XT报价在5299元左右,对位的非公RTX 4080 Super报价则是8599元,N卡贵了60% 。其 着实游戏性能方面,这两款显卡并没有太大差距 。
现在AMD也意识到了AI 利用关于GPU的重要性,加大了对AMD ROCm平台的投入, 通过不停的更新,如今AMD ROCm 6.0在AI算力方面的 晋升早已超出了大多数发烧友的预知 。
在我们的测试中,RX 7900 XT在Linux系统下 使用Stable Diffusion ROCm 6.0版时,其出图效率 几乎是Windows系统的2倍 。再外加55TFOPS的单精度浮点运算性能以及20GB GDDR6X超大容量显存,关于有较高专业AIGC 利用需要的专业消费者而言,在有限的 估算下,RX 7900 XT 能够说是十分 合适的 取舍 。
固然,也 指望AMD 能够 接续优化ROCm在Windows系统下的性能 体现,让更多的AMD消费者能 占有自己的高性价比AIGC显卡 。