PassMark 揭示英伟达 RTX 50 系列显卡性能问题根源:弃用 32 位 OpenCL 和 CUDA 支持 |
珠江路在线
2025年3月4日
【
转载
】传奇世界网页版
|
本文标签:英伟达RTX 50系列,显卡性能问题,32位OpenCL,CUDA支持,Blackwell架构,兼容 |
3 月 4 日 信息,科技媒体 Tom's Hardware 今日(3 月 4 日)公布博文,报导称英伟达新一代 GeForce RTX 5090、RTX 5080 和 RTX 5070 Ti 显卡计算性能低下的一个重要缘由,是英伟达在其“Blackwell”架构中 悄悄 停留了对 32 位 OpenCL 和 CUDA 的 支撑,招致与现有测试工具和 利用程序存在兼容性问题 。
援引博文介绍,PassMark Software 针对英伟达 RTX 50 系列显卡进行 Direct Compute 基准测试时,发现返回了 舛误代码“CL_OUT_OF_RESOURCES (-5)”,且 部分包括 32 位代码的模块 体现低迷 。
随后 考查发现在 RTX 50 系列 GPU 上,32 位 CUDA 利用程序 无奈直接运行,需依赖 CPU 解决,招致性能大幅 降落 。
该团队 通过 考查, 只管基准测试的重要 利用程序多年来向来是 64 位,但 部分计算子测试仍 使用 32 位代码,这些代码在 RTX 4000 及更早的显卡上运行 畸形 。
NVIDIA 并非蓦地终止 32 位 CUDA 支撑,而是通过 屡次更新逐渐淘汰 。PassMark 团队猜测,这一问题可能通过 32 位到 64 位的翻译层解决,但英伟达并未提供官方解决 方案 。
PassMark 还指出,这一 变迁并不能 彻底解释 DirectX9 性能不佳的缘由,暗示可能有 其余架构 变迁影响了旧版渲染路径 。 只管 PassMark 已更新其软件,但旧版基准测试可能仍会受到影响 。
关于开发者而言,将旧版代码 迁徙至 64 位环境,可能 波及大量底层操作和内存治理的 批改,但大多数开发者已逐渐转向 64 位代码 。
PassMark 当前正在将受影响的 OpenCL 代码移植到 64 位,以便正确测试新显卡的计算 威力 。不过该团队也 忠告称,在不 批改源代码之前,许多包括 32 位 OpenCL 组件的现有 利用程序,可能永远 无奈在 RTX 5000 系列显卡上 畸形运行 。