神秘面纱终于揭开:AMD 展示 Vega “织女星” GPU架构行业
一年一度的CES国际消费电子展将于美国拉斯维加斯当地时间2017年1月5日到8日正式举行,CES可以说是科技行业一年的风向标,每年在此露面的技术和产品,会在接下来的一段时间里走进全球消费市场乃至千家万户。关注CES 2017资讯,敬请关注什么值得买“CES 2017汇总新闻”。
历史总是一次次重演,面对英伟达的攻势,AMD从不会选择沉默,而是直面予以正面回击。在此次CES 2017大会上,那边万众期待的英伟达GTX 1080TI跳票让人遗憾,这边AMD则信心十足的带来了Vega,并对RADEON Vega“织女星”进行了全面介绍,首次向外界揭开了Vega新一代架构的神秘面纱。
AMD Vega(“织女星”Alpha Lyrae,缩写为αLyr)是Lyra天琴座中最亮的星,也是夜空中第五亮星,寓意强大。此次VEGA一共有200项新功能,主要有四点:高带宽,新的可编程几何引擎、下一代计算单元和高级像素引擎。
AMD Vega是世界上具有最高效、最灵活的显存架构,不同于以往依靠堆料以量取胜,HBC技术依靠HBM2可以带来更高频率和带宽,是第一代的2倍,达到2Gbps/pin,堆叠容量则是8倍,达到8GB,Vega核心旁集成的两块核心正是HBM2,虽比GDRR5小许多但此次Vega核心面积超过以往。新一代HBM和HCC机制的加入,可以在游戏中带来更好的表现。AMD展示了《巫师3》、《辐射4》游戏运行的显存占用情况,表示传统GDRR5的效率并不高,HBM2和完善的优化可以让VEGA比任何时候更省显存,更高效。
Vega具有可编程几何引擎,更加灵活的同时还加入了原语着色器(Primitive Shader),可快速抛弃没用的语句,令其执行效率更高。此外,载入均衡机制也有所改进,VEGA智能工作组分配器,高效率地为计算引擎、几何引擎、像素引擎分派不同的任务负载。
计算引擎单元(NCU)此次改变最大,VEGA可以智能的在单个FP32 ALU内处理一对FP16浮点操作,如果彼此兼容的话就可以打包到一起作为FP32进行处理,由此带动峰值吞吐能力翻番。同时,寄存器还可以把一个FP32拆分成两个FP16,载入存储指令也可以转移FP16。Vega仍然有64个ALU,FP32每时钟周期操作数128个也和GCN一样,但没有介绍具体是如何组织的。Vega NCU同时针对高频率、高IPC进行优化,提升GPU综合性能。此外,可同时进行计算和图形处理,并且能够根据负载不同而变换SIMD单元宽度,以往需要多个计算单元才能完成的任务,现在只需一个就能搞定,效率更高。
最后,高级像素引擎将重点解决低效率渲染问题,高速缓存内执行,像素和纹理访问不一致等问题,实现硬件存储一致性。
总体上看,Vega“织女星”可以带来更高的带宽,新的编程几何引擎,新的引擎单元以及高级像素引擎。关于VEGA规格细节以及显卡产品并未提及,具体的发布时间也仍是个迷。
▼AMD产品部门负责人CTO展示Vega核心
▼AMD在现场搭建了Ryzen CPU和Vega显卡的一套主机,演示运行的《玩星球大战:前线》,在4K全高画质下帧数可以维持在60帧左右,偶尔会下降到57或58fps。
▼AMD Vega 官方PPT