![]() |
逼A卡价格现原形 GTX680性能全面测试 |
(2012-3-23)
|
● 黑科技的最深处:Scheduling过程 在整个GTX680以及Kepler构架中, 潜藏最深同时可能产生的影响也最为深远的改良,来自 使命调度以及仲裁过程的 硕大 变迁。 GPU的逻辑 构造决定了它并不 合适被用来执行关联度过高过深的条件分支过程, 因此关于 使命的关联性 审查是整个GPU 使命队列执行过程中一个十分主要的步骤。在以Fermi为代表的传统仲裁体系中, 使命会在解码过程之后 实现指令的关联性 审查,假如指令存在超过 定然限度的关联性,为了 躲避条件分支对性能产生的影响,这些指令会被再一次打包以便ALU团簇进行吞吐。在 实现这些关联性 审查之后,明确执行方向的指令才会被送入流水线中进行执行。为了加速这一过程的速度,Fermi构架为这个过程提供了Multiport Post decode Queue以及对应Register的硬件 支撑。
在Kepler构架中,这一传统的过程 产生了 硕大的 变迁,NVIDIA称在Kepler中 使命会在解码之前依据Sched.info进行 取舍, 而后直接进行解码并被送入流水线中 实现后续 解决。整个关联性 审查以及指令重组等过程被一个 容易的Sched.info-select所取代。在该过程下,指令从解码到执行 几乎没有延迟,整个流水线 因此 获得了极高的执行效率。 关于这一改良,我们的评介是“这 彻底是一个黑科技”。从过程来看,这一看似 容易的过程实际上已经具备了初步的分支预测的特质,这较之Fermi构架“随机抽取方向 而后一条路跑到黑”的分支论断有了长足的 普及。将 使命关联性 审查提前到解码过程之前也极大地加大了流水线的执行密度,进而 晋升了整个GPU的单元复用率。但受限于NVIDIA公布技术细节方面的保留,我们目前还 无奈 深刻到这一改良的核心 部分。所以,我们暂且将其 概括到诸多 晋升GTX680性能但却未被公布的“黑科技”中的一个,并将对其 维持 连续的关注。 |
![]() |
百度中 逼A卡价格现原形 GTX680性能全面测试 相关内容 |
![]() |
Google搜索中 逼A卡价格现原形 GTX680性能全面测试 相关内容 |