显卡_挑战卡皇TITAN！GTX 780 SLI巅峰测试_显卡报价,参数,显卡图片,显卡评测文章,南京珠江路

您的位置 >> 显卡测评室 >> 挑战卡皇TITAN！GTX 780 SLI巅峰测试

挑战卡皇TITAN！GTX 780 SLI巅峰测试

(2013-6-6)

GK110核心流式多解决器(SMX)架构

Kepler GK110的新SMX引入几个架构创新，使其不只成为有史以来最壮大的多解决器，而且更具编程性，更节能。

SMX: 192个单精度CUDA核、64个双精度单元、32个特殊性能单元(U)和32 个加载/存储单元(LD/ST) 。

SMX 解决核架构

每个Kepler GK110 SMX单元存在192单精度CUDA核，每个核彻底由浮点和整数算术逻辑单元构成。Kepler 彻底保留Fermi引入的IEEE 754-2008 标准的单精度和双精度算术，包括积和熔加(FMA)运算。

Kepler GK110 SMX 的设计指标之一是大大普及GPU的双精度性能，由于双精度算术是许多HPC 利用的核心。Kepler GK110 的SMX还保留了特殊性能单元 (U)以达到和上一代GPU 类似的快捷超过运算，所提供的U数量是Fermi GF110 SM的8倍。

与GK104 SMX单元类似，GK110 SMX单元内的核使用主GPU频率而不是2倍的着色频率。2x着色频率在 G80 Tesla 架构的 GPU 中引入，并用于之后所有的 Tesla 和 Fermi‐架构的GPU 。在更高时钟频率上运行执行单元使芯片使用较少量的执行单元达到特定指标的吞吐量，这本质上是一个面积优化，但速度更快的内核的时钟逻辑更耗电。关于Kepler，我们的首要使命是的性能/功率比。固然我们做了众多面积和功耗方面的优化，然而我们更偏向优化功耗，甚至以增

加面积成本为代价使大量解决核在能耗少、低GPU频率状况下运行。

Quad Warp Scheduler

SMX以32个并行线程为一组的模式调度历程，这32个并行线程叫做Warp 。而每个SMX中占有四组 Warp Scheduler 和八组 Instruction Dispatch 单元，同意四个Warp同时发出执行。Kepler 的 Quad Warp Scheduler 取舍四个 Warp，在每个循环中可以指派每 Warp 2 个独立的指令。与 Fermi 不同，Fermi 不同意双精度指令和部分其余指令配对，而 Kepler GK110 同意双精度指令和其余特定没有注册文件读取的指令配对例如加载/存储指令、纹理指令以及一些整数型指令。

每个Kepler SMX 包括4组Warp Scheduler，每组Warp Scheduler包括两组 Instruction Dispatch单元。单个Warp Scheduler单元如上所示。

我们奋力优化SMX Warp Scheduler逻辑中的能源。例如，Kepler和Fermi Scheduler 包括类似的硬件单元来解决调度性能。其中包括：

a) 记录长延迟操作(纹理和加载的存放器

b) Warp 内调度决定(例如在合格的候选 Warp 中取舍出最佳 Warp 运行)

c) 线程块级调度(例如，GigaThread 引擎)

然而，Fermi的scheduler还包括复杂的硬件以预防数据在其本身数学数据路径中的弊病。多端口存放器记录板会纪录任何没有有效数据的存放器，依赖审查块针对记录板综合多个彻底解码的 Warp指令中存放器的使用状况过，确定哪个有资格发出。

关于 Kepler ，我们意识到这一信息是确定性的(数学管道延迟是不变量)，因此，编译器可以提前确定指令何时预备发出，并在指令中提供此信息。这样一来，我们就可以用硬件块替换几个复杂、耗电的块，其中硬件块提存入之前确定的延迟信息并将其用于在 Warp 间调度阶段屏蔽Warp，使其失去资格。

[1]　[2]　[3]　[4]　[5]　[6]　[7]　[8]　[9]　[10]　[11]　[12]　[13]　[14]　[15]　[16]　[17]　[18]　[19]　[20]　[21]　[22]　[下一页]

	百度中挑战卡皇TITAN！GTX 780 SLI巅峰测试相关内容
	Google搜索中挑战卡皇TITAN！GTX 780 SLI巅峰测试相关内容

显卡品牌推荐

显卡评测导购:

显卡新闻:

	硬件首页　便携电脑　装机推荐　三大件　主板　显卡　显示器　外设　硬件驱动　维修维护
	显卡首页　显卡报价大全　显卡新闻　显卡导购　显卡评测　显卡技术　显卡驱动