![]() |
NVIDIA全新顶级核心揭秘:猛得吓人! |
2016年4月13日
【
转载
】 编辑:
浏览次数:
|
|
静默了许久的GPU显卡市场终于 热烈起来了!AMD的北极星、NVIDIA的帕斯卡两大真正崭新的架构马上盛大登场,各种爆料让人 冲动不已 。
今日,TechPowerUp又拿到了帕斯卡家族顶级大核心GP100的架构示 用意,对它的 根本规格也终于有了一个清晰的 意识 。
GP100核心架构总图
可以看出,帕斯卡架构的GP100核心在大体上 依旧沿用了NVIDIA GPU这些年的设计思路,但规模更 增 壮大,也有一些 加强之处 。
整个核心被分成了6组GPC(图形 解决簇),这是具备高度独立性的GPU单元, 占有自己的渲染前端和后端 。
每个GPC内包括10组SM(流式多 解决器单元),而每个SM 占有64个CUDA核心,也便是整个GPU 占有60组SM、3840个CUDA核心,同时还有240个纹理单元 。
已经 宣告的高性能计算卡Tesla P100只开启了56组SM、3584个CUDA核心, 即便如此也比麦克斯韦家族GM200核心(3072个CUDA核心)大了整整四分之一!
在图片边缘 可以看到八组显存操纵器,构成了4096-bit HBM2的规格,可提供720GB/s的超高带宽( 实际上最高能做到1TB/s) 。
另外还 可以看到一个新的“High-speed Hub”(高速操纵 核心),由此伸出四个NVLink总线端口,官方号称单向带宽80GB/s,但不清晰是每个端口的,还是 群体的 。
NVLink总线 类似多 解决器系统中的Intel QPI、AMD HT, 可以高速直连多个GPU,并 支撑真正的内存 虚构化,可大大加快GPU计算性能 。
只管规模如此 宏大,帕斯卡核心依旧 可以运行在超高频率上,Tesla P100的核心 根底、加快频率就分别有1328MHz、1480MHz,热设计功耗300W 。
别忘了,GP100核心可是和AMD Fiji一样集成了四颗HBM2显存和中介层,能做到如此大规模、高频率, 着实不方便 。
GP100核心SM单元架构图