编辑增强加速引擎会导致手机电脑出现卡顿现象是什么原因吗

2012年02月07日 00:01作者:冯锋编辑:文章出处:泡泡网原创

    泡泡网显卡频道2月7日 显卡市场经历了一年的冷淡期,直到HD7970发布,才掀起一次狂潮,目前高端单芯显卡被GTX580和HD7970垄断。HD7970较GTX580优势明显,所以价格也高高在上。但是从现在起享受强劲的图形性能,我们又多了一种选择。这一天,全世界的高端玩家们不用再为HD7970的高价而发愁了。同样为28nm制造,全新的GCN次世代图形架构,支持DX11.1+PCIE3.0,包含1792个流处理器的HD7950如约而至。

    时隔HD7970发布22天后AMD再次为我们带来一场图形的盛宴,HD7950虽然舍弃了部分性能,但是拒绝了HD7970的高成本、高价格。如果因为HD7970过于昂贵而无法割舍GTX580,那么您有了新的选择,因为HD7950来了!

    HD7950能带给我们什么?具体规格又有如何精简?相比上一代显卡有何进步?对比旗舰HD7970性能上又有何损失?跟GTX580比又有何优势?今天笔者将为大家揭开HD7950的神秘面纱。

    次高端显卡往往由旗舰级的核心屏蔽而来,这主要也是考虑到用户的需求、消费能力以及良率问题。比如GTX580和GTX570、HD6970和HD6950的关系。大家可能注意到了,为企业带来最大利润的往往不是旗舰产品,而是中高端性能级产品,因此HD7950及HD7800系列从很大程度上决定了AMD今后一年内在显卡领域的作为。

    HD7950相对于HD7970而言,屏蔽了4组GCN共计256个流处理器和16个纹理单元。频率也较925/5500MHz降为800/5000MHz。但是功耗却降为200W,因此仅需2个6PIN辅助供电接口。这将会对Tahiti核心造成多大的性能损失?还能否一人之下万人之上?请看小编为您娓娓道来。

HD7950的核心架构图(被屏蔽的GCN阵列可能出现在任意位置)

GCN阵列微观结构(内含64个流处理器和4个纹理单元)

    如上图所示,HD7950相比HD7970,在规格上只是被屏蔽了四组GCN阵列,最终结果就是流处理器和纹理单元有所减少,光栅单元和显存位宽没有任何损失,所以笔者认为HD7950的规格删减还是很厚道的。

    在前不久HD7970发布时,在我们的首发评测文章《》已经对Tahiti核心技术与架构进行了全面介绍,因此本文只做简要介绍,因为HD7970与HD7950除了性能有差别之外,技术、架构、功能方面没有任何区别。

    这是AMD官方公布的Tahiti核心架构图,第一眼看上去,我们就会发现他与以往所有的AMD GPU架构有了明显区别,无论图形引擎部分还是流处理器部分都有了天翻地覆的变化,如果没有右侧熟悉的UVD、CrossFire、Eyefinity等功能模块,很难相信这是一颗AMD的GPU。

Tahiti的图形引擎部分

Cayman的图形引擎部分

    这一部分Tahiti几乎没有什么变化,依然是双图形引擎的设计,几何着色指令分配器、顶点着色指令分配器、曲面细分单元、光栅器、分层消影器都是双份的设计。

    除此之外,还有一个毫不起眼但是意义重大的改进,那就是在图形引擎上方加入了两个ACE(Asynchronous Compute Engine,异步计算引擎),这两个引擎直接与指令处理器、几何引擎及全局数据缓存相连,作用是管理GPU的任务队列,将线程分门别类的分发给流处理器。

ACE将会充当指令处理器的角色用于运算操作,而ACE的主要作用就是接受任务并将其下遣分配给流处理器(主要是分配的过程)。全新架构强化了多任务的并行处理设计,资源分配、上下文切换以及任务优先级决策等等。ACE的直接作用就是新架构拥有了一定程度的乱序执行能力,虽然严格意义上新架构依然是顺序执行架构,一个完整线程中的指令执行顺序不能被打乱,但是ACE可以做到对不同的任务进行优化和排序,划分任务执行的优先级别,进而优化资源。从本质上来说,这与很多CPU(比如Atom、ARM A8等等)处理多任务的方式并没有什么不同。

    而且ACE的加入大幅提升了Tahiti的几何性能,并且使得通用计算时的指令分配更加有序和并行化,缓存使用率和命中率更高。

    单从数量上来看,Tahiti明显不如GF100的4个光栅化引擎(光栅器+分层消影器)以及8个多形体引擎(几何/顶点分配器及曲面细分单元等)。不过AMD有针对性的强化了曲面细分单元,通过提高顶点的复用率、增强片外缓存命中率、以及更大参数高速缓存的配合下,HD7970在所有级别的曲面细分环境下都可以达到4倍于HD6970的性能:

    看得出来,AMD的Tahiti在图形引擎方面依然沿用Cayman的设计,从Cypress到Barts再到Cayman,AMD稳扎稳打的对图形引擎进行优化与改进,AMD认为现有的双图形引擎设计足以满足流处理器的需要,因此只对备受诟病的曲面细分模块进行了改良,如此有针对性的设计算是亡羊补牢、为时不晚。

    看了上页图形引擎部分的介绍,很多人可能会失望——基本没动嘛,还说什么次世代图形核心?别着急,好戏在后头。我们知道AMD历代GPU的瓶颈除了曲面细分以外,其实最重要的是5D/4D VLIW架构的效率问题。现在Tahiti的GCN架构就是要解决这个问题,它的流处理器结构已经面目全非了。

    通过Tahiti的整体架构图我们看到,传统的SIMD流处理器阵列消失了,取而代之的是GCN阵列,Tahiti总计拥有2048个流处理器,这样每个GCN阵列里面拥有64个流处理器。现在来看看GCN阵列的微观结构。

    GCN阵列里有4组SIMD单元,每组SIMD单元里面包括16个流处理器、或者说是标量运算器。GCN架构已经完全抛弃了此前5D/4D流处理器VLIW超长指令架构的限制,不存在5D/4D指令打包-派发-解包的问题,所有流处理器以16个为一组SIMD阵列完成指令调度。简单来说,以往是指令集并行,而现在是线程级并行。

GF100的SM(流处理器簇)微观结构

    每组GCN阵列有一个标量运算单元,用于执行整数指令、媒体指令和浮点原子操作,这个标量运算单元拥有自己的4KB寄存器

    而GF100的缓存设计得更加灵活,每组SM里面拥有总计64KB的共享缓存+一级缓存,这64KB缓存可以根据实际运算量来动态调整,如果把16KB分配给一级缓存的话,那剩下的48KB就是共享缓存,反之亦然。

    一般来说,进行图形渲染时需要共享缓存比较多,而并行计算时则会用到更多的一级缓存。GF100这种灵活的缓存分配机制更适合做并行计算,而GCN架构更大的共享缓存会有更好的图形渲染性能,并行计算则会稍逊一筹。

    从缓存部分的设计来看,虽然GCN拥有更大的缓存容量,但在并行计算领域经营多年的NVIDIA显然要棋高一手。

    从线程级别来看,GCN与SM是不可分割的最小单元,GCN一次可以执行64个线程,而SM是48个(其实就是流处理器的数量)。

    从多线程执行上来看,GCN可以同时执行4个硬件线程,而SM是双线程调度器的设计(参见架构图)。

    在流处理器部分,终于不用费劲的把AMD和NVIDIA GPU架构分开介绍了,因为GCN与SM已经没有本质区别。剩下的只是缓存容量、流处理器簇的数量、线程调度机制的问题,双方根据实际应用自然会有不同的判断,自家的前后两代产品也会对这些数量和排列组合进行微调。

    在流处理器部分,我们看到Tahiti与GF100如此相似,那么接下来看到缓存设计时,您可能会要惊呼了……看图说话:

    先说最直观的,Tahiti有一个容量为768KB二级缓存,这个容量与GF100的L2完全相同,都可以进行读写操作。

    一般来说非图形渲染不需要用到纹理缓存,而图形渲染时又不会用到一级缓存,所以Tahiti将一级缓存与纹理缓存合并的设计更优;但NVIDIA专门设计纹理缓存也不是没有道理,当GPU既渲染图形又要做计算时,分离式设计的效率会更高,比如PhysX游戏……A卡不支持所以AMD不会考虑这种情况。

    Tahiti整个GPU拥有一个32KB的全局数据共享缓存,这个是沿用了Cayman的设计,但容量减半了,而GF100没有这种缓存。全局数据共享缓存主要用于不同GCN阵列间线程的数据交换,这块缓存只对编译器可见,所以使用率较低,容量减半相信也是处于这个原因。

    最核心的流处理器和缓存部分介绍完毕,剩下的功能模块就简单了:

    AMD作为GDDR5显存标准的制定者之一,对于显存特性吃得比较透,因此同样的显存颗粒,A卡的显存频率一直都远高于N卡。此次AMD在位宽上追平NVIDIA,再加上更高的频率,显存带宽达到了264GB/s,基本上不会有什么瓶颈了。

    Tahiti配备了32个ROPs,数量与Cayman,每个周期能完成32个色彩处理和128个Z/Stencil 处理,不过得益于有更高的显存带宽,在实际游戏中的性能要比理论值一样的Cayman快50%,比如抗锯齿方面。

    PCI-E 3.0同时还特别增加了128b/130b解码机制,可以确保几乎100%的传输效率,相比此前版本的8b/10b机制提升了25%,从而促成了传输带宽的翻番,延续了PCI-E规范的一贯传统。

    新规范在信号和软件层的其他增强之处还有数据复用指示、原子操作、动态电源调整机制、延迟容许报告、宽松传输排序、基地址寄存器(BAR)大小调整、I/O页面错误等等,从而全方位提升平台效率、软件模型弹性、架构伸缩性。

    至于PCI-E 3.0总线的意义,现在看来有些超前。目前只有Intel的X79+i7-3960X平台才会提供PCI-E 3.0支持。根据经验和测试,PCI-E 3.0翻倍的带宽并不会给显卡带来性能提升,其主要意义还是进一步对于多卡的支持。试想,如果PCI-E 3.0 X4都可以满足HD7970的需求的话,那么现有的Z68(搭配IvyBridge处理器)就不会限制多路交火的性能表现,而X79插8块(如果主板有这么多插槽的话)HD7970做并行计算也不会因为接口带宽而产生性能瓶颈。

    一如其在DX10.1上的率先支持一样,HD7970/50的发布也让AMD再一次在DX规格支持上获得领先。DX11.1,相比目前广泛应用的DX11规范,它的升级能带来什么样的技术改变,需要什么样的软件平台,什么时候才有支持DX11.1的游戏或者应用呢?

GCN架构图中明确指示说支持“下一代图形API”,也就是DX11.1了

  从小数点后的步进来看,DX11.1只是一次版本上的小步快跑而非大步飞跃,所以不会有什么激动人心的功能变化,但是这不代表DX11.1没有亮点,相反DX11.1的看点还是挺多的。

  1.加入3D立体支持

  DX11发布后的这两年,DX图形技术没啥变化,但是伴随3D电影兴起的3D游戏也火了起来,体验过3D游戏之后大多数人都会觉得很震撼(也有人觉得很晕),栩栩如生的感觉不再是“科幻”。DX11.1很重要的一点改进就是增加了D3D 3D API,可以让开发者通过D3D实现3D渲染。

微软提供通用3D立体显示支持可谓DX11.1众多新功能中最耀眼的一个了

  之所以这么说是因为目前实现3D立体显示的技术要么是部分绕过D3D API而使用四倍缓冲器(Quad Buffer)实现3D游戏或应用,要么就是利用驱动/中间件实现的。在DX11.1中,3D渲染可以通过新增的D3D API实现,而且微软的D3D 3D API并非排他性的,依然支持其他驱动/中间件方案。换句话就是DX11.1之后,开发者多了一个实现3D的选择。

  TBDR(Tile Based Deferred Render,延迟渲染贴图)也是DX11.1中新增的一个操作指令。它原本是Power VR公司使用的3D渲染技术,主要用在智能手机以及平板、游戏机等设备上。与传统z缓冲的渲染过程相比,TBDR不需要渲染不可见像素,这样极大地减少了数量运算量,非常适合移动设备使用。

  这项技术对桌面图形计算来说并没有太大意义,只是DX11.1并不只会用在桌面显卡上,还承载着微软扩张移动领域疆土的希望,TBDR依然是DX11.1中的重要功能,低功耗设备的福音。

  3.TIR目标独立光栅化

  TIR(Target Independent Rasterization,目标独立光栅化)的功能要求有所不同,因为前面的两项技术只需升级DX11.1运行时程序即可,而TIR却需要更改硬件设计,因此只有新一代显卡才能支持,无法在原有显卡上直接升级。

  Rasterization光栅化是图像处理的后期过程,DX11.1支持目标独立光栅化,可以将原本CPU负责的工作完全转移到GPU上,进而提高D2D的抗锯齿性能。

  4.支持双精度浮点运算

  双精度浮点运算(Double-precision shader functionality)或者叫FP64不仅在GPU计算上意义非凡,在图形渲染中也大有用武之地。虽然DX11中其实已经包含了FP64双精度支持,但是功能有限,DX11.1中才真正实用化。

  5.图形与视频之间的操作性更灵活

  DX11.1强化了图形、视频等各种资源之间的操作灵活性,比如计算渲染器(Compute Shader)可以通过Media Foundation处理视频(video),并将以前的D3DDX9、D3DX10视频处理全部统一到D3DX11中去,可以简化编程,提高效率。

  以上列举的只是DX11.1规范功能升级的一部分,在微软的MSDN页面上有详细的DX11.1功能介绍,不过里面的内容主要针对开发者/程序员,普通读者读起来肯定头大,我们也不需要搞这么复杂。

  简单来说,DX11.1相对DX11只是一次优化升级,但是从DX10到DX10.1性能有提升的经验来看,DX11.1可能也有小小的惊喜,即便画质上没有提高,性能也会因效率的提高而受益多多。

● DX11.1什么时候发布,支持平台如何?

  微软之前称DX11.1将伴随Win8一起发布,不过Win8开发者预览版上还是DX11,至少也要等到Win8 beta之后了,时间上差不多是明年2月份,最惨的就是要等待正式版发布了,这个就没准了。由于软硬件平台都没准备好,所以目前还没有一个基于DX11.1的游戏或者demo,不知道一向敢为人先的Unigine公司什么时候放出第一个DX11.1 demo。

DX11.1走向实用还要等Win8发布之后

  综上来看,DX11.1只是显卡架构升级中的小甜点,不能当成大餐,不过甜点也有自己独特的味道,就看厂商如何应用了。AMD先发制人,又一次用行动证实了自己在支持DX11规范上的领先。

    整体上由于采用了全新的设计架构,新的南方群岛显得性价比稍微偏低,不过在中低端市场AMD也拿出了只有139美元的Radeon HD 7750,另外AMD还将推出HD 6000系列的28nm版本,型号将被更改为HD 7000系列。

LE,流处理器数量得到进一步缩减,上市日期将在2012年第二季度。

DDM Audio(独立数字多点音频):

    HD7950的标准接口配置则是一个Dual-Link DVI、一个HDMI、两个Mini-DP。外观上是把一个Dual-Link DVI和DP替换成了两个Mini-DP,实际上是将原来的DL-DVI做成了一路mDP输出。样做的好处就是,一片显卡可以直接接驳任何类型的数字显示设备而不需要转接,另外让三路独立Audio输出成为可能。这就是传说中的DDM

上一代显卡只能同时输出一路音频

    新一代显卡Radeon HD 7900则是第一款支持多频音频流同步独立输出的GPU,可以同时输出三路独立的数字音频。每个音箱上都会有声音,而且可以完全不同,远程视频会议一卡搞定!

    当然了,DDM Audio技术支持音频和视频的绑定和同步切换,所有音频和视频都是完全无缝同步的。一部正在播放的视频从一个显示端切换到另一个显示端,音频信号智能迁移而无需手动更改。

- 2010年3月:催化剂10.3支持边框补偿、显示器单独色彩调整、多屏分组、改进多屏配置切换。

- 2011年4月:催化剂11.4,配置界面改版。

    催化剂11.12和明年催化剂12.1/12.2将会陆续支持的则有:Eyefinity+HD3D多屏立体技术、自定义分辨率(等待太久了!)、预设管理改进、桌面和任务栏重新定位。

    最后一项,之前三屏系统上桌面图标会停留在第一屏,任务栏则横跨三个屏幕,看起来很费劲,今后则会全部集中在中央屏幕上,就像单屏那样。

HD3D(立体显示技术):

    必须承认,NVIDIA是一家很有远见的公司,一年多前就研发成功的3D Vision立体显示技术,现在已经成为整个IT业界的发展趋势。但AMD的3D立体显示技术从HD6000开始也获得了长足的进步,而在HD7000上已经越来越成熟。

    首先在硬件方面,只要能够支持120Hz刷新率的输出,就可以在PC上实现3D显示技术。而想要在平板电视和投影仪上实现3D输出、120Hz刷新率、1080p全高清的3D立体游戏,左右眼各有60Hz,都能达到60FPS的流畅帧率,就需要高带宽的HDMI 1.4a标准的支持,上一代显卡中HD率先做到了,而HD7000更是不在话下。

    DisplayPort 1.2 HBR2、HDMI 1.4a都有超高带宽,单个接口即可满足4K×4K分辨率输出,显示设备方面的支持不是问题,市面上主流的3D电视、投影仪,还有120Hz LCD或者双面板LCD都能支持ATI显卡,尤其是三星和LG都有多款型号早已上市。

    支持AMD HD3D立体技术的游戏正在越来越多,现已超过600款,而且可以选择第三方的iZ3D、DDD或者原生的HD3D等不同方案,其中原生的有:《尘埃3》、《战地3》、《杀出重围3:人类革命》、《两个世界2》。

    目前AMD的3D显示技术,无论效果、兼容性还是软件支持度方面,都丝毫不差于3D Vision。无论是对于3D游戏的立体化,还是2D视频的3D化,都得到了主流媒体播放器的支持,而且AMD的新一代UVD3引擎还能支持3D蓝光硬解码,可以说已经相当成熟了。

    CUDA是NVIDIA显卡的一大卖点,它能够将GPU庞大的运算能力释放出来,对非3D游戏应用软件进行加速,实现比纯CPU运算更快的效能。CUDA目前虽然有很多种类的软件,但最主要的应用还是集中在视频编辑和转码方面。

    Radeon HD 7900系列上的APP加速技术包括三个方面:独立的硬件高清视频加速引擎、增强的计算硬件和软件、基于AMD APP SDK开发包的应用生态系统。

    AMD此番带来了新的高清编码技术“视频编码引擎”(VCE),其核心功能是一个多流硬件H.264高清编码器,编码速度甚至超过的播放速度,而且支持完全固定、混合计算两种编码模式。

    质量方面支持4:2:0色彩取样,针对游戏和视频场景变化做出优化,并且可以自行控制压缩质量。此外还支持音频视频复合,显存输入用于转码、视频会议,GPU显示引擎输入用于无线显示。

    TMT 5.2还进行了新概念的重新设计,包括Alpha混合用户界面、本地与在线媒体管理、电影元数据搜索、DVD电影和视频片段智能菜单、2D-3D实时转换插件Sim3D等等。

    WinZip 16.5,通过Corel、AMD的合作,针对A卡优化,现在可以利用OpenCL进行Deflate压缩、Inflate解压、AES加密的加速,并且能够同时利用处理器、集成/独立显卡的资源。官方宣称,APU使用集显或独显的测试证明,WinZip 16.5 AES加密的速度提升了两三倍。

    AMD APP生态系统:浏览器与插件、消费级视频编辑、办公与地图、流行媒体播放器。

    还有新的媒体处理指令SAD(绝对差值和),这是多项关键视频与图像处理算法的关键操作,包括动态监测、姿态识别、食品与图像搜索、深度提取、计算机视觉等等。

    Steady Video技术也将进化为2.0版本,不过这里AMD只是介绍了基本原理,没有公开新特性,据说支持QSAD硬件加速、隔行模式视频、左右对比模式。

    AMD演示Demo基于Bullet Physics Library物理加速技术,著名的3DMark 11测试工具的DirectCompute就是基于此技术。另外电影《2012》、《怪物史莱克4》、《游戏总动员3》和《马达加斯加》等都是用了该技术,通过物理计算实时渲染复杂光照模型以及材质。

   来自一线AIB大厂——讯景,其旗下的一款HD7950产品,讯景作为A卡最为优异优异品牌,多次在业内引领潮流,此次推出的Radeon HD 7950自然也不例外,下面就让我们一起来看看此款显卡。

    供电方面采用采用,公版的7相数字供电设计,全固态电容的用料为稳定性提供了保障。外接供电接口采用6pin+6pin设计,并且支持全新的eroCore Power”(核心零功耗技术),使得待机功耗仅为3W。

    在散热方面依然采用的是,双风扇+真空腔均热板的设计,非公版的外形配合两只9CM的涡轮风扇,在散热方面的表现也十分的出众。

    同样来自一线大厂的迪兰恒进也第一时间为我们带来了HD7950酷能+版显卡。

    作为老牌的A卡厂商——镭风显卡也第一时间为我们带来了HD7950毒蜥版显卡,其完全遵循AMD公版设计,红黑配色的涡轮风扇彰显了AMD公版显卡的高贵品质。

    虽说板型为全公版,但是其频率确实超频版。镭风HD7950 龙蜥版显卡采用最新的28nm制作工艺的HD7950显示核心,其内部坐拥1792个流处理器,借助GDDR5显存的5000MHz高频优势搭配超频版900MHz的核心频率,使其有追赶大哥HD7970的实力。

    之前说到了迪兰,就不得不提蓝宝,作为AMD阵营的两位大哥级厂商之一蓝宝为我们带来了2款HD7950产品。首先我们来看一下地位略低的HD7950白金版显卡。

    我们可以看到,蓝宝在HD7950上延续了使用蓝色PCB的传统。蓝色的PCB被硕大的但风扇散热器所覆盖。给人一种很沉稳的感觉。

    接下来的时间该轮到蓝宝的HD7950至尊版了,该卡的外形很对得起其至尊的称号,硕大的双凤扇,密集的鳍片以及粗壮的热管均彰显了高端的风采。

    老牌板卡大厂——微星也为我们带来了其R7950显卡,包装沿用了微星之前的风格,包装上印着AfterBurner的标志,意识着该卡可以通过AfterBurner软件(原RivaTuner,已被微星收购)跨越AMD驱动限制去挑战极限频率。

    HD7950至尊版的核心频率达到了830MHZ,超过公版30MHZ,显存为公版的5000MHZ,相信其性能较公版略有提升。而且Tahiti Pro核心的极限也不止于此,还有很大超频空间。

    作为AMD的核心合作伙伴当中的纯A卡的AIB厂商屈指可数,全球只有HIS、迪兰(撼讯)、蓝宝三个厂商。早已进入国内市场的迪兰和蓝宝已经具备很成熟的市场占有率,而HIS是唯一一直没有染指国内市场的AIB厂商。

    不过这种局面从今天开始已经改变!我们今天得到消息,大名鼎鼎的HIS借本次AMD发布HD7950的时机,正式进军国内市场,在国内发布了一款型号为HIS 7950 Fan 3GB GDDR5的显卡!如今世界三大A卡品牌齐齐亮相。三国鼎立的局面即将形成,一场大戏即将到来。

● 测试模式与测试方法:

    此次发布的显卡定位高端游戏玩家,性能十分强劲,测试时所有游戏中开启全部特效,包4X抗锯齿(AA)和16X各向异性过滤(AF)。虽然很多游戏提供了更高精度的AA,但由于实用价值不高,且没有可对比性,所以不做测试。

    为了做到全面客观,有对比和参考,分辨率测目前最主流的,和更高阶的。目前也有部分显示器是(),游戏在这种分辨率下的性能表现与差不多,FPS稍低一点点,使用这种显示器的朋友依然可以参考我们的测试成绩。

● 测试平台配置:

    此次测试平台选择了Intel最高端的六核心处理器,搭配最新的X79芯片组,与Radeon HD7950系列强强联手,定位次旗舰显卡之战。

    AMD此次发布的新品HD7950,我们自然会拿它与自家上代产品HD6970和HD6990进行对比。至于N卡方面,则选择了单芯最强的GTX580进行对比,同时奉上HD7950超频的成绩,总计六款显卡项目测试。

    除了OC项目外,其他参测显卡都使用NVIDIA和AMD双方的公版规格和公版频率,这样测得的性能和功耗发热数据最有参考价值。

软件介绍:做为目前最为权威的性能测试软件,3DMark Vantage在3D基准性能测试,可以全面准确的得出显卡的真实性能,所以在历次测试中都少不了它的加盟。3DMark Vantage所使用的全新引擎在DX10特效方面和《孤岛危机》不相上下,但3DMark不是游戏,它不用考虑场景运行流畅度的问题,因此Vantage在特效的使用方面比Crysis更加大胆,“滥用”各种消耗资源的特效导致Vantage对显卡的要求空前高涨。

Vantage中直接内置了四种模式,分别为Extreme(旗舰级)、High(高端级)、Performance(性能级)和Entry(入门级),只有在这四种模式下才能跑出总分,如果自定义模式就只能得到子项目分数了。我们此次测试选择了Extreme(旗舰级)进行测试。

    3DMark Vantage 是目前验证显卡DX10性能较好的工具,不过由于其采用了PhysX物理加速技术,导致N卡总分偏高。因此N卡在此测试项目中的排名,相比3Dmark11中有所提升。

    Crysis(孤岛危机)无疑是DX11出现之前对电脑配置要求最高的PC游戏大作。作为DX10游戏的标杆,Crysis的画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏。Crysis还有个资料片Warhead,使用了相同的引擎。

画面设置:Crysis只有在最高的VeryHigh模式下才是DX10效果,但此前所有高端显卡都只能在低分辨率下才敢开启DX10模式,如今的DX11显卡终于有能力单卡特效全开流畅运行。为了让不同用户都能找到参考的成绩,我们测试了和256X1600两种分辨率4AA两种模式

测试方法:Crysis内置了CPU和GPU两个测试程序,我们使用GPU测试程序,这个程序会自动切换地图内的全岛风景,我们跑两遍得到稳定的平均FPS值。

    虽然显卡已经更新换代数次,但《孤岛危机》仍然是目前的杀手级游戏。在1080P分辨率下开启4倍抗锯齿HD7950还是可以流畅运行,但是到了的怪兽级分辨率,其性能就略显不足。

游戏介绍:自《孤岛惊魂》系列的版权被UBI购买之后,该公司蒙特利尔分部就已经开始着手开发新作,本作不但开发工作从Crytek转交给UBI,而且游戏的故事背景也与前作毫无关系,游戏的图形和物理引擎由UBI方面完全重新制作。

画面设置:借助于蒙特利尔工作室开发的全新引擎,游戏中将表现出即时的天气与空气效果,所有物体也都因为全新的物理引擎,而显得更加真实。你甚至可以在游戏中看到一处火焰逐渐蔓延,从而将整个草场烧光!而且首次对DX10.1提供支持,虽然我们很难看到。

测试方法:游戏自带Benchmark工具。

    所有参测显卡表示《孤岛惊魂2》毫无压力,看来用其作为测试游戏是个失误。

    时至今日,依然没有任何一个测试软件或者游戏能够取代3DMark在游戏玩家心目中的地位。但是到了《3DMark11》,因为A/N显卡测测试成绩和游戏成绩有不小出入,质疑之声四起。

    3DMark11的测试重点是实时利用DX11 API更新和渲染复杂的游戏世界,通过六个不同测试环节得到一个综合评分,藉此评判一套PC系统的基准性能水平。

1、原生支持DirectX 11:基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面细分、计算着色器、多线程。

2、原生支持64bit,保留32bit:原生64位编译程序,独立的32位、64位可执行文件,并支持兼容模式。

3、全新测试场景:总计六个测试场景,包括四个图形测试(其实是两个场景)、一个物理测试、一个综合测试,全面衡量GPU、CPU性能。

4、抛弃PhysX,使用Bullet物理引擎:抛弃封闭的NVIDIA PhysX而改用开源的Bullet专业物理库,支持碰撞检测、刚体、软体,根据ZLib授权协议而免费使用。

    赛车游戏中,轰鸣的发动机声、风驰电掣的急速快感,足以让无数玩家肾上腺素飙升。也许正是如此,才使得《科林麦克雷:尘埃3》在众多游戏中备受玩家青睐。

  《尘埃3》采用与《F1 2010》同样的Ego引擎,拥有更加拟真的天气系统及画面效果。游戏将包含冰雪场景、动态天气、YouTube上传、经典的赛车、分屏对战、party模式、开放世界、更多真实世界中的赞助商和车手等特点。

    相比首款DX11游戏的《尘埃2》,《尘埃3》在诸多DX11游戏特效的力助下,游戏画质表现更加出色。无论是日出还是日落,下雨还是干燥,看上去都非常逼真。背景的烟花和观众让游戏代入感非常强。车身会随着比赛的进行染上泥土或者雪,一辆崭新的赛车或许会在比赛完成之后,变成一辆被泥土覆盖的“垃圾车”。

  图像方面,《尘埃3》是该系列至今为止最漂亮的一款。《尘埃3》中的驾驶感相当不错,6种调整选项也足以应付各种地形。而且,在芬兰、密歇根、挪威、洛杉矶、肯尼亚和摩纳哥驾驶赛车狂飙真的是一种享受。赛车会对相当细微的操作做出回应,在雪地或泥地中,这一点尤其重要。而当你的对手把雪花和泥浆弹到你的挡风玻璃上时,你只能依靠自己的直觉和细微的操作不至于翻车。而游戏中,雪花、雨滴和夜晚驾驶不仅仅是外在的装饰而已,和现实生活一样,你需要各种赛车配件来应对这些情况。

    在A卡御用游戏《尘埃3》中,HD7950被GTX580击败,但是差距微乎其微,预计下一版本驱动将会带来更强劲的性能。

  由EA DICE工作室开发的《战地3》采用了最新的“寒霜2”引擎,完美支持DirectX 11,并且拥有强大的物理效果,最大的亮点还是光照系统,其渲染的场景已近乎乱真的地步,视觉效果堪称绝赞。游戏还支持即时昼夜系统,为玩家营造一个亲临现场的真实环境。

    寒霜2引擎最大的特点便是支持大规模的破坏效果。由于考虑到游戏的画面表现以及开发成本,DICE放弃了以只支持DX9的WINDOWS XP操作系统。另外由于该引擎基于DX11研发,向下兼容DX10,因而游戏只能运行于WINDOWS VISTA以上的的操作系统。

    在《战地3》中,“寒霜引擎2”内置的破坏系统已经被提升至3.0版本,对于本作中的一些高层建筑来说,新版的破坏系统将发挥出电影《2012》那般的灾难效果,突如其来的建筑倒塌将震撼每一位玩家的眼球。

   《战地3》采用了ANT引擎制作人物的动作效果。在此之前,ANT引擎已在EA Sports旗下的《FIFA》等游戏中得到应用,不过在FPS游戏中使用尚属首次。相较于Havok等物理引擎,用ANT引擎可以花费较少的精力制作出逼真的效果。举例来说,战士在下蹲时会先低头俯身、放低枪口,而不是像以前的游戏那样头、身、枪如木偶般同时发生位移。此外,ANT引擎也可以让电脑AI的行动更加合理。但这款大作目前并不能良好的兼容120Hz3D以及红蓝3D模式。

Predator》同时登陆PC、X360和PS3,其中PC版因为支持DX11里的细分曲面(Tessellation)、高清环境光遮蔽(HDAO)、计算着色器后期处理、真实阴影等技术而备受关注,是AMD大力推行的游戏之一,但是这样的主题难免让本作有很多不和谐的地方,暴力血腥场面必然不会少!发行商世嘉在2009年11月就曾明志,表示不会为了通过审查而放弃电子娱乐产品发行商的责任,因为游戏要维持“异形大战铁血战士”这一中心主题,无论画面、玩法还是故事线都不能偏离原著。

测试方法:游戏带Benchmark,其中测试画面颇代表意义,很好的体现了Tessellation异形身体以及HDAO等高级特效,希望这些特效能让系统发挥所有潜力。

    《Aliens vs. Predator》是首批支持DX11的游戏之一,但相比前面的《尘埃2》加入了更多DX11特效,对显卡性能有一定的要求。因此当测试画面中出现了N个异型以后,HD6970有些吃不消,其他显卡则表示压力不大。

    游戏介绍:《地铁2033》(Metro 2033)是俄罗斯工作室4A Games开发的一款新作,也是DX11游戏的新成员。该游戏的核心引擎是号称自主全新研发的4A Engine,支持当今几乎所有画质技术,比如高分辨率纹理、GPU PhysX物理加速、硬件曲面细分、形态学抗锯齿(MLAA)、并行计算景深、屏幕环境光遮蔽(SSAO)、次表面散射、视差贴图、物体动态模糊等等。

    画面设置:《地铁2033》虽然支持PhysX,但对CPU软件加速支持的也很好,因此使用A卡玩游戏时并不会因PhysX效果而拖累性能。该游戏由于加入了太多的尖端技术导致要求非常BT,以至于我们都不敢开启抗锯齿进行测试,只是将游戏内置的效果调至最高。游戏自带Benchmark,这段画战斗场景并不是很宏大,但已经让高端显卡不堪重负了。

测试说明:如果说是CRYSIS发动了DX10时代的显卡危机,那地铁2033无疑是DX11时代的显卡杀手!地铁2033几乎支持当时可以采用的所有新技术,在画面雕琢上大肆铺张,全然不顾显卡们的感受,和CRYSIS如出一辙。然而CRYSIS靠着特效的堆积和不错的优化,其惊艳绝伦的画面和DX9C游戏拉开了距离,终究赚足了眼球;而地铁则没有这么好运了,画面固然不差,BUG却是很多,招来了大量的非议。

    特效的滥用,超大的纹理和复杂的模型,也许4A Games本来就没打算让这款游戏流行。本次测试我们使用4AA抗锯齿+全特效来考验显卡,现在高端显卡玩地铁2033终于像是一款游戏而不是幻灯片或者别的什么了,而HD7900系列则让我们看到了一线曙光。

  《孤岛危机2》是《孤岛危机》的续作,游戏采CryENGINE 3引擎所制作。在游戏内容上与一代也有很大变化,已经从秘密的丛林作战转向了公开、大规模的现城市战争。故事发生在距一代3年后的2023年。外星人在地球上的大片区域挑起了战争,各大城市都遭到攻击,人口锐减,玩家将要进行捍卫地球的末日战争。

CE3拥有不逊于CE2的画面表现,并且带来了诸多的新特性和强大的SandBox3编辑器,同时新引擎也能适应目前的PS3/XBOX360家用机平台,带来家用机上的高水准发挥,同时代表作Crysis2将登陆PC/XBOX360/PS3平台,引擎支持DirectX9/DirectX10/DirectX11,DX11版本仅PC,且要下载补丁。由于是一款NVIDIA的THE WAY游戏,所以此游戏DX11版本优化了N卡。

    《孤岛危机2》中AMD一血前耻,默认频率下的HD7950也能略微领先GTX580,超频之后更是将其远远甩在身后。

    在另一款标杆性DX11游戏《Stone Giant》中,通过曲面细分+置换贴图达到了的画质提升同样非常显著,整个场景的细节程度获得大幅加强,让画面更加逼真。

游戏介绍:游戏引擎开发商BitSquid与游戏开发商Fatshark近日联合公布了一个展示DX11强大技术的DEMO。这个名为《StoneGiant》(石巨人)的DEMO,可以让玩家来测试自己PC显卡的DX11性能。BitSquid Tech即将提供PC平台的引擎,并且大概在今年第三季度将提供PS3和Xbox 360等其他平台的引擎。

    置换贴图由于需要大量的顶点去进行位移,所以需要模型具备足够数量的多边形,而曲面细分做的事情也正是如此,这也就成为了它提升画面质量的第二重作用。

画面设置:StoneGiant是一款重量级的DX11测试软件,之所以这么说是因为它大量使用了DX11的招牌特效:曲面细分和景深特效,可以让显卡的DX11性能表露无遗。进入之后可以选择开启关闭Tessellation以及DOF(DX11级别景深)进行测试,这两项技术都十分消耗资源,尤其是同时打开时。其中Tessellation技术对画质的改善最为明显,测试时默认开启Tessellation、打开DOF进行测试。

    石巨人是另一款DX11性能测试软件,在之前测试中,A卡的“压力”依然很大,DX11特效使用的越多,其表现就越差,因为HD中均只有一个曲面细分单元。HD7950在这个测试项目中惜败GTX580。

    Tessellation如此重要,所以首款DX11测试程序——Heaven Benchmark中,几乎所有的场景都是由Tessellation技术动态生成的,地图中央的飞龙,和周围凹凸不平的砖墙、石阶和瓦片给人留下了深刻的印象。

    在这幅图中,大家注意观察左侧的墙壁(以及凸出石块的阴影)、右侧的台阶和下方的鹅卵石路,Tessellation技术生成的是实实在在的顶点和曲面,所有的岩石、台阶和石块都是独立存在,而不再是平面上的虚拟贴图而已。

画面设置:2.5版本进一步强化了Tessellation技术的应用,细分精度更高,画面更上一层楼。

    Extreme模式的Tesselation实际上却没有多少实际意义,因为加重曲面细分级别并没有带来显著的画质改善,却大大加重了显卡的负担,FPS损失非常惨重。此项测试只能片面的证明显卡的Tesselation性能,并不能代表显卡在实际DX11游戏中的表现。

    在经历了两年前阿卡姆疯人院带来的震撼后,Rocksteady终于在今年年底带来了蝙蝠侠的续作——阿卡姆之城。这款游戏也在上市之初让我们见识出了正统版权的威力,有华纳兄弟的赞助与发行,完全再现电影和小说中的原著桥段不再是梦,100%的高还原度让玩家犹如身临其境,再现了一个荧幕上真实的蝙蝠侠或许也是这部游戏的成功所在。

   《蝙蝠侠:阿卡姆之城》仍然建立在《阿卡姆疯人院》的气氛上,不过这次上升至阿甘之城——高谭市内戒备森严的,关押了大量暴徒的监狱之中。而且新作还汇集了众多明星参与的配音阵容以及蝙蝠侠中的极度凶残的恶棍,并改进和加强了一游戏特点,让玩家们拥有像《蝙蝠侠前传2:黑暗骑士》一般的终极游戏体验。

   阿卡姆之城的画面,绝对是当今次时代游戏中数一数二的,但是其开发引擎却依旧是虚幻3,这着实让许多玩家感叹,到底虚幻3引擎还有多大潜力可以发挥。虽然虚幻3引擎目前来看最大的问题就是画面普遍油腻感十足,但是在阿卡姆之城中,少许的油腻感却成了点睛之笔,让蝙蝠侠更加贴近漫画、电影。

除了虚幻3的引擎外,蝙蝠侠从上一代作品中就加入了NVIDIA的PhysX物理加速引擎。在游戏的细节中,更加贴近真实效果,烟雾、灯光、人物的衣服、报纸等等细节全部通过PhysX物理引擎计算,游戏中的破碎、打击效果随之表现的也不在那么匪夷所思。但是,凡事都有两面,真实的受力表现换来的则是大量的资源占用,这也使得蝙蝠侠这个虚幻3引擎的游戏一下成为了硬件杀手,如果达到非常好的游戏表现,恐怕非GTX580这样的旗舰单卡莫属了。

    通过测试成绩我们发现在PhysX游戏中使用CPU强行开启PhysX特效显然不如N卡使用显卡加速来得快,不过幸好支持PhyX的游戏大作不是很多。

● 《文明5》纹理压缩

    总体来说采用了GCN架构的Radeon HD 7950,在很多通用计算性能方面实现了质的飞跃,只是在一些NVIDIA优势项目上依然落败GTX 580,总体表现相当出色。

6970执行效率提升非常大,这大概也是AMD不在Tahiti上面继续增加ROP的目的吧!
     我们的功耗测试方法是直接统计整套平台的总功耗,既简单、又直观。测试仪器为微型电力监测仪,它通过实时监控输入电源的电压和电流计算出当前的功率,这样得到的数值就是包括CPU、主板、内存、硬盘、显卡、电源以及线路损耗在内的主机总功率(不包括显示器)。

    待机为windows7桌面下获得的最小值;满载是以模式运行Furmark时的最大值,Furmark能够让显卡稳定的以100%满负载模式运行,测得的功耗值比一般的游戏要高一些。

显卡空闲整机功耗测试(显示器除外)

显卡满载整机功耗测试(显示器除外)

    满载功耗方面,HD7950控制的也是非常出色,即使超频以后性能飙升,功耗依然低于GTX580,表现非常完美。

    AMD新君HD7950对比NVIDIA卡皇GTX580完全是压倒性的性能优势,在大部分游戏中都保持较大的领先幅度,而在2560大分辨率的考验下,拥有3GB显存的HD7950优势更加明显,就算加权N卡优势项目,平均值依然领先GTX580!只在两款Tessellation Benchmark、PhysX游戏中及个别游戏告负。

    可能有些人会说,HD7950无论核心频率还是显存频率,都要比GTX580高不少,这样对比会否有失公允?如果您有这个疑虑的话,那么不妨看看表格最下方的功耗测试,无论是待机功耗还是满载功耗,HD7950比GTX580都要低一些。

    这就意味着,A卡无论单位功耗下的性能、还是显卡整体性能,都已经胜胜过目前的高端N卡了。

    上一代的AMD单芯卡皇HD6970无论规格还是架构,都无法和HD7970相提并论,因此性能表现也难以同日而语,HD7950整体性能领先HD%。

    而且仔细看来,HD6970能跑出这个成绩也属侥幸了,主要是在一些对CPU要求很高的物理游戏或者对显卡要求相对低的游戏中,FPS达到极限,CPU成为瓶颈。否则会输的更惨!

    总体来看,长江后浪推前浪,HD7950完全秒杀上一代的HD6970!虽然因为规格的大幅提升,满载功耗上升而来11.86%,但能耗比依然是大幅提升。当然这里并不是说HD6970废柴一条!HD7950价格定位本身也高出HD6970不少,HD6870依然有自己的用户定位和市场空间。

    但是为何要除去BatMan2?因为在BatMan2测试时,驱动和游戏版本并没有最完善版本,双芯并没有发挥作用,反而拖累了性能表现。如果加入BatMan2的成绩,HD6990领先幅度将大打折扣。

    既然明知有Bug,为何还要放上成绩?小编这里其实想借机告诉想多GPU集联的朋友,近年来双芯显卡抑或双卡CF虽然效率出众,性能爆表,但并非完美。并不是所有游戏的不同版本都能兼容。存在即为合理,我们测试就不得不考虑到这种情况而加以说明。

    默认频率下的HD7950完败于HD7970在我们的预料之中,毕竟HD7950的频率及规格与旗舰级产品HD7970有一定的差距。但是总体差距并不是特别巨大,除了功耗和《蝙蝠侠2》外,平均相差了14.14%。

    HD7950作为AMD定位次高端的显卡,默认频率高达800/5000MHz。但28nm的工艺极限并不在此。和此前显卡测试不同,前面所有的效能测试中我们均特意加入了MHz的成绩,原因有三:

1、Radeon HD7950 超频之后,性能表现非常稳定,在所有测试项目中均无花屏死机或者驱动停止响应的情况发生。

2、Radeon HD7950 超频MHz,并不需要更改核心和显存电压,而功耗增加也非常少,基本可以忽略。

3、Radeon HD7950 超频至MHz,相对于默认频率功耗增加非常小,基本可以忽略。

    很显然GTX580已经不是HD7950的对手,因此我们不应该停留在单纯对比性能与价格这种初级阶段了,在本文的最后,我们来回顾和总结一下HD7950的几大特点。

● 非常先进的28nm工艺

    GPU的制造是一项极为复杂的过程,GPU制造工艺的先进与否决定了GPU的性能优劣。事实上GPU的发展史也可以看作是制作工艺的发展史。更先进的制造工艺意味着更高的集成度,更高的性能。说制作工艺的改进是GPU发展带来最强大的源动力亦不为过。

    工艺和架构的革新让Radeon HD7950拥有更低的能源利用效率,而这也是首次旗舰显卡拥有个位数的待机功耗。

    在应用体验方面,南方群岛在上一代北方群岛的基础上更上层楼。更加先进的Eyefinity2.0和HD3D技术无疑让A卡用户有了更高端的视觉享受机会。

    AMD曾经背负效率低下骂名的SIMD架构,在HD6000终于笑到了最后。凭借超大规模的流处理器、以及改进的双超线程分配处理器,HD6000的效率比起HD5000有了明显的提升。如果继续优化扩充的老路,28nm工艺、43亿个晶体管的HD7000性能飙升也是可以预期的。

    反观NVIDIA架构想要扩充流处理器的话,需要耗费更多的晶体管,由此导致NVIDIA的GPU核心面积要比AMD同级别产品大不少,而大核心除了成本较高之外,还得面对良品率较低、功耗较大的负面影响。既然如此,为何AMD还要进行大规模的架构革新?

    随着技术的发展,图形和计算的概念已经不再像以往分的那么清楚了,进入DX11时代时候,全新API新特性赋予GPU更多的任务和使命。“通用计算”这一专业术语越来越多的现于新闻、见诸报端。AMD作为全球领先的GPU制造厂商,为高性能计算做出了巨大的贡献,而这次AMD下定决定进行大规模的架构革新很大程度上也是为了这方面做出的考虑。

    AMD能够在架构革新的同时,进一步降低功耗与发热,还能提升性能、增强功能实在难能可贵,而各方面都非常优秀的HD7950无疑让下一代NVIDIA高性能级的显卡压力增加不少!而2012显卡市场注定不会寂寞!

    作为生力军的HD7000系列显卡,在今年能有多大作为我们还不得而知,主要还是看NVIDIA能拿出什么产品来抗衡AMD的GCN架构。但是就目前的格局来看显卡市场的主动权已经由AMD所掌握。因此AMD也不傻,不会用HD7970屈身和GTX580厮杀,那样会降低HD7970的地位,因此这也是HD7950出世的一个重要理由。

HD7950的性能在默认频率下比GTX580强得不是很多,但是得益于28nm制程以及优秀的核心效率,通过简单的超频即可将GTX580打得满地找牙,在超频到1GHZ/6300MHZ的时候甚至将大哥HD7970超越。预计首批HD7950上市之后价格会在3000元到3500元之间,等大量铺货后有很大几率降到3000元以下的售价。届时NVIDIA压力将会很大,期待AMD RADEON HD7950的市场表现,更期待NVIDIA为我们带来HD7970的死敌。■

我要回帖

更多关于 电脑出现卡顿现象是什么原因 的文章

 

随机推荐