北京时间 2023 年 8 月 18 日,在位于深圳市的英特尔大湾区科技创新中心内,英特尔举办了一场线下技术分享会。作为受邀媒体之一,《微型计算机》也参加了本次技术分享会。在这次会议上,英特尔除了带媒体人员参观了大湾区科技创新中心之外,还将重点放在了锐炫显卡的性能与功能更新进化上,并由英特尔中国区技术部总经理高宇先生向我们讲解了锐炫显卡驱动在DX11 方面的性能更新、全新概念GPU Busy的登台,以及加入了Frametime、GPU Busy监测的PresentMon Beta软件的新亮相。接下来,就请跟随《微型计算机》的镜头,一起来看看这场有料的线下技术分享会吧!
(相关资料图)
众所周知,尽管凭借CPU的强势地位,英特尔在集显市场风生水起,但除去“远古时代”曾昙花一现的个别产品之外,英特尔其实还真算得上是现代独显市场的新生力量。严格意义上要说起来,可能 2022 年 10 月左右Arc锐炫显卡的发布才是英特尔正式进入独显市场的标志。不过不可否认的是,在联合了以蓝戟科技为首的AIC厂商的共同努力下,过去的 10 个月时间里,Arc独显的市场与性能表现也算是有目共睹,也收获了比较不错的成绩。
其实玩家们都看得到,从Arc锐炫显卡发布以来,英特尔在驱动更新方面一直都是兢兢业业,更新的步调非常频繁。在差不多 10 个月的时间里,锐炫显卡驱动已经更新超过了 30 个版本,针对DX9 和DX11 游戏做了大量的优化,也使得锐炫显卡每过一段时间就能取得性能上的猛涨。同时英特尔也与时俱进,为 57 款新游戏提供了首 发日的优化支持。这一切都说明英特尔这次在Arc独显上寄予了厚望,不只是雷声大,更是想要为现在的独显市场注入一场“暴雨”。
更新优化的步伐不会停歇,随着Arc独显驱动新版本的发布,Arc独显又从新驱动上获得了19%以上的DX11 性能提升,同时英特尔还提出了GPU Busy的概念来阐释了驱动优化的核心方向,并为玩家带来了PresentMon Beta这一款直观好用的GPU状况及游戏帧率监测软件。
驱动优化更新再前行,DX11 游戏性能提升可达19%
在锐炫独显发布之初,英特尔将驱动性能优化的重点放在了DX9 游戏性能的提升上,事实上我们也看到在 2023 年Q1~Q2 的几个月时间内,英特尔陆续发布的多版锐炫显卡驱动将DX9 游戏性能表现提升达到了平均约43%的恐怖程度。而同时,英特尔还在前几个月内针对锐炫显卡的价格进行了大调整, 1799 元的锐炫A750 显卡也因此获得了非常优 秀的性价比表现。在当时的 4086 版驱动与 3490 版首 发驱动的比较中(《微型计算机》当时也有实测驱动性能对比,感兴趣的玩家可以参考我们之前的文章),包括《英雄联盟》《CS:GO》等热门游戏在内的性能提升都是非常明显的。
显然,从Q2 开始,英特尔就已经着手于DX11 游戏性能的驱动优化工作。在英特尔看来,目前市场内受众最多的热门游戏,仍然是DX11 的天下,如《CS:GO》《DOTA 2》《PUBG》等莫不如此。因此英特尔认为为这些受欢迎的DX11 游戏提供优化解决方案是当下的重点所在。
为此,从Q2 开始,英特尔陆续在驱动更新上朝着DX11 性能的优化发力,到现在最 新的驱动对比,相对于首 发驱动,新版本的新驱动程序在DX11 游戏方面有了平均数十帧的提升幅度,同比增长幅度达到了5%~33%,平均帧率增长幅度约为19%。
在除去决定游戏卡顿程度的1%L fps的低帧分布集之外,99 Percentile代表了游戏流畅度的直观体现。从英特尔给出的资料来看,新旧驱动的99 Percentile也有了显著的提升,相较于 3490 版驱动,新版本驱动的提升幅度达到了9%~45%,平均达到了20%以上。这也意味着玩家能够获得更加丝滑顺畅的游戏体验。
看得出,英特尔想要表达的意思就是新驱动在DX11 游戏性能上提升了19%,在游戏流畅性上提升了20%。当然,我们相信在未来的一段时间内,DX11 游戏性能的持续优化,都将是锐炫显卡驱动更新的主要努力方向,未来相信也应该会有更多的DX11 游戏加入优化列表,持续提升锐炫显卡的价值。
FrameTime与GPU Busy,用驱动优化平衡CPU与GPU以提升性能
在会上,英特尔给出了一个比较有意思的数据,那就是同样在新驱动的优化支持下,同样在基于锐炫A750 显卡的平台上,他们发现酷睿i9 处理器的提升幅度反而小于酷睿i5 处理器的提升幅度。从上图中我们也可以看出,酷睿 i9 处理器平台性能提升平均约12%,这也算是相当大的提升,但比起酷睿 i5 来说,提升幅度还是稍微逊色一些。
有个很简单的道理,决定水桶容量的是最短的那块木板。集显的游戏性能受限于iGPU自身,而对于大多数主流独显来说,不少时间内的游戏性能表现反而受限于CPU的性能及优化。
这是一个简化了的图形渲染输出的示意图。在这一工作流程中CPU会将游戏想要呈现的效果画面进行物理层面的逻辑计算,以“Present”指令发给DirectX API再向GPU发出渲染指令,驱动程序就在DirectX API和GPU执行之间充当了桥梁作用,它将DirectX(或是Vulkan等) API的命令转换为GPU能执行的指令并通知GPU渲染输出,此时“Present”再次返回GPU,通知开始下一个“Present”循环。
从图中可以看出,CPU准备渲染命令发送给GPU每一帧渲染画面指令都存在一个时间,也就是前后两次“Present”的时间间隔,即图中的Frametime(每帧时间),某种意义上,它代表的是“CPU有多忙”。而在GPU渲染部分,GPU渲染的每帧时间英特尔将其称为“GPU Busy”,代表的是“GPU有多忙”。
详细的原理讲起来比较话长,简单且形象地说,CPU相关的Frametime可以理解为CPU准备每一帧画面的渲染指令所需要的时间,而GPU Busy则可以简单理解为GPU渲染每一帧画面所需要的时间,驱动程序要做的事情,就是解释CPU指令、转换DirectX命令给GPU渲染。所以Frametime越低、波动越小,说明CPU处理每一帧渲染指令的时间越短,也就代表CPU能处理的游戏fps(每秒帧数,即帧率)能力越强。对GPU Busy时间来说也是如此。因此最理想的情况就是二者完全同步,实现最 佳的性能平衡。
编者注:Frametime和GPU Busy不与游戏最终fps呈现直接挂钩,仅是瓶颈参考数据。
在 3490 版老驱动程序下,可以看到Frametime较高,抖动比较厉害,也就意味着它每秒能处理的画面帧数相对较低,会影响游戏的整体fps表现,此时CPU应该是性能瓶颈。(蓝色为Frametime,黄色为GPU Busy)
新的锐炫独显驱动专门针对Frametime进行了优化,显著改善了Frametime。可以看出Frametime排列更加紧密,而且大幅度减少了抖动,使得Frametime与GPU Busy无限接近,显著改善了游戏帧率表现。(蓝色为Frametime,黄色为GPU Busy)
在CPU受限的系统中,GPU较为悠闲,它的处理非常迅速,此时游戏整体帧率表现受限于CPU的处理能力。
英特尔展示的这两幅比较图表比较有意思。在1080p低画质设置下,游戏整体受限于CPU处理能力,可以看到Frametime与GPU Busy'差距很大,抖动厉害。而将画质设置为超高时,显著增加了GPU的负荷,此时游戏的整体性能表现上CPU与GPU基本达到了较好的平衡。相信很多玩家这时就会想,我怎么去直观地看到,我的系统游戏性能是CPU受限、GPU受限还是能很好地平衡呢?英特尔在本次沟通会上推出的PresentMon Beta或许能解决玩家的疑虑。
监控一目了然,PresentMon Beta
在本次分享会上,英特尔也向媒体介绍了换新出镜的PresentMon软件。这是一款可以查看GPU的功耗、温度、电压或任何独立硬件供应商提供的其他信息。PresentMon Beta支持多个硬件厂商, 同时兼容Intel、NVIDIA、AMD的GPU和CPU相关产品。同时,它也提供了对DirectX 11、12、OpenGL、Vulkan等API的全面支持。这是一个可配置的工具,可以叠加显示在游戏画面上,提供多个可监控参数,包括之前讨论的Frametime和GPU Busy。
和GFE、Radeonsoftware的Overlay界面非常相似,PresentMon Beta可以提供fps平均帧率、99 Percentile等游戏帧率指标的实时显示,同时特别的是,它还提供了Frametime和GPU Busy这两个参数的监控显示。通过这两个参数的实时变化曲线,玩家就可以很清楚地看到自己的系统瓶颈是在CPU或是GPU,又或者二者处于非常美妙的平衡状态下。跟踪这两个参数的变化曲线,也能方便玩家针对自己的系统情况做出实时的调整。假如你看到Frametime波动巨大,且与GPU Busy相差较大,那么毫无疑问是CPU受限,二者如果基本重合则说明系统较为平衡或是处于GPU受限状况。
▲在主界面上还可以进行自定义需要PresentMon Beta跟踪的程序及快捷键等操作。
▲Overlay游戏内叠加显示的配置界面,可以自定义界面显示效果、数据刷新频率等参数,同时英特尔表示PresentMon Beta的资源占用非常低,对游戏体验几乎没有实质性影响。
从这次的线下分享会来看,英特尔确实在独显领域做出了自己最 大可能的努力。持续不断地驱动更新优化为锐炫显卡带来了持续的活力与高保值,让锐炫显卡每隔一段都能产生“物超所值”的感想。同时,本次分享会上亮相的PresentMon Beta也很好地解决了锐炫显卡玩家对性能的DIY诉求,知其然且知其所以然,这样才是DIY最 大的乐趣。在分享会之后,与会媒体也就一些玩家比较关心的问题和英特尔的相关负责人进行了沟通。在这里,我们也摘录了部分问题放在这里,以飨读者。
Q:PresentMon Beta软件是否支持其他显卡和CPU?
英特尔:目前PresentMon Beta支持所有类型的CPU和GPU,也支持包括DX、Vulkan和OpenGL在内的绝大多数API。
Q:PresentMon Beta是集成在Arc Control(英特尔锐炫独显控制面板)里还是单独下载?
英特尔:目前不会集成到Arc Control中,大家可以自由下载和自由使用。
Q:能否再为玩家详细讲讲新的驱动如何让Frametime和GPU Busy更适配?
英特尔:优化的目的是怎么让GPU Busy部分和Frametime尽量接近。我们知道,CPU部分前面有等待的时间,CPU转成所有DX的命令以后,就要在那儿等,发出第 一个Present就要等,我们的目标是如何让等的时间更少。过去驱动更新时DX9 和DX11 大幅提升,我们攻坚的核心困难点就是CPU 受限。其实英特尔GPU的渲染能力是非常强的,在跑3D Mark的结果就已经能看到这点,那是比较真实地反映基本渲染能力的。但是我们过去的驱动效率不够高。在过去的八个月里,我们把CPU的等待效率提升了N倍。这就解释了为什么在i5 上看到收益最 大,因为i5 CPU肯定比i9 弱一点,CPU效率越低端的CPU收益肯定越大。我们想不断地通过挤压CPU侧的效率,从而把锐炫独立显卡的潜能彻底发挥出来。
文/夏松 Microcomputer
(推广)
标签: