快科技12月3日音书,Intel今天肃穆发布了代号Battlemage的第二代锐炫B系列显卡,首发两型号锐炫B580、B570,而此时距离第一代A系列最初登场照旧两年多了。
两款新品定位主流市集,主要面向2K超高画质游戏玩家,梗概对标NVIDIA RTX 4060系列、AMD RX 7600系列。
因为凭据Intel提供的数据,1080p在游戏玩家中的占比逐年递减,如今照旧降至56%,2K分辨率则增长到了22%,瞻望到2026年即可结束反超。
这一代,Intel主打三个亮点:最好性价比、XeSS 2、AI加快。咱们会逐个和民众先容。
新的Xe2架构在前代Xe基础上进行盛大的优化改造,尤其是插足了盛大元气心灵对架构的兼容性和软件支出进行重构和优化。
Xe2不仅进一步升迁了软件的适配性,还增强了架构的着力,提高了资源应用率,非凡是松弛了软件对硬件的支出。
先来看一下两款新卡的公版规格,后边再讲架构和本领。
锐炫B580配备了20个新一代Xe2中枢(分为5个切片),对比上代A580反而少了4个中枢与1个切片,同期有20个光追单元、160个XXM AI引擎。
不外,中枢频率从1700MHz大幅提高到2670MHz,弥补了中枢数目的不及,INT8算力性能从197 TOPS来到了233 TOPS,升迁幅度约18%。
显存位宽从256-bit降至192-bit,然而容量从8GB GDDR6扩大到12GB GDDR6,等效频率也从16GHz提高到19GHz,因此带宽从512GB/s稍许降至456GB/s。
整卡功耗190W,只加多了戋戋5W,从而大大提高了能效比,只需单个8针供电。
锐炫B570作念了一部分精简,配备18个Xe2中枢、18个光追单元、144个XMX引擎,中枢频率略降至2500MHz,INT8算力性能203 TOPS。
搭配160-bit 10GB GDDR6显存,等效频率依然是19GHz,带宽380GB/s,整卡功耗仅为150W。
系统总线接口很缺憾并不是PCIe 5.0,况且从PCIe 4.0 x16砍半为PCIe 4.0 x8,天然对这种级别的卡来说影响不错忽略不计。
硬件解码救助AV1、HEVC(H.265)、AVC(H.264)、VP9、XAVC-H,然而不救助更新的VVC(H.266)。
视频输出救助HDMI 2.1、DisplayPort 2.1 UHBR 13.5——上代是DP 2.0 UHBR 10。
官方声称,锐炫B580对比定位更高的锐炫A750,平均性能升迁幅度可达24%。
非凡是掀开XeSS之后,升迁愈加显然,《堡垒之夜》以至可达78%,《刺客信条:幻景》也能有56%。
对比竞品RTX 4060,平均最初幅度为10%,接头到各样身分,不错梗概视为二者基本在合并档次,和RX 7600也基本差未几。
莫得达到之前预期的RTX 4060 Ti的水平,有点小缺憾。
不外无论对比RTX 4060照旧RX 7600,锐炫B580的一个显贵上风即是显存多了一半,在游戏中更辞谢易爆显存,脱手AI负载时也更多余力。
这一次,Intel依然打造了官方公版,也即是限量版。
仍旧是双电扇、双插槽、玄色作风,要点优化了散热遐想,后面有一半皆作念了散热格栅,风骚更大,杂音也更低。
首批合营伙伴除了老一又友宏碁、华擎、蓝戟、旌宇,还新增了两家,一是长年主打高性价比的铭瑄,二是新的傲世创科(Onix)。
各品牌盛大皆作念了双电扇、三电扇两种遐想,除了宏碁暂时唯有一款双电扇,傲世创科则皆是双电扇。
锐炫B580显卡将于12月13日肃穆上市(12日晚评测解禁),订价249好意思元起。
要知说念,锐炫A750两年多前首发的时候,照旧要289好意思元。
锐炫B570显卡则要比及来岁1月16日才会开卖,订价219好意思元起。
其实,Lunar Lake即酷睿Ultra 200V系列处理器中照旧率先应用Xe2架构的核显,也即是锐炫140V、锐炫130V,如今终于来到了桌面寂然显卡,将来还会继续进入札记本寂然显卡、车载决议、镶嵌式决议等。
Intel暗示,Xe2架构相干于初代,要点即是升迁各方面的着力,包括更高的应用率、更好的负载分拨、更好的软件支出等等。
同期,Xe架构降生两年多来,Intel一直在费力完善驱动、游戏的生态救助,先后迭代了50多个版块的驱动,新游戏0日救助卓著120款,游戏适配优化数目也比当初加多了2.5倍。
这即是Xe2的合座架构图,主体依然是渲染切片,这是扫数这个词SoC芯片的基本结构,配合提醒前端、二级缓存组成一个合座,和第一代如出一辙,基本没啥变化。
每个渲染切片内包含4个Xe中枢(策划引擎)、4个光追单元,以及4个采样器、几何单元、光栅单元、HiZ单元(头绪Z)、两个像素后端等模块。
各个部分的具体变化,下边阻隔来讲。
二代Xe2中枢除了赓续原生救助SIMD16提醒,还加多了对SIMD32的救助,天然不是原生,但实践SIMD32提醒是没问题的,从而或者更好地分拨策划资源,还救助64位原子操作。
每个Xe中枢里面,包含8个512位的矢量引擎(XVE)、8个2048位的XMX引擎,比上代减少了足足一半,可能鼎新着力会更高、更机动。
这一次,Intel为每个Xe中枢加入了多达256KB容量的一级缓存、腹地分享缓存(SLM),大大松弛了对二级缓存的依赖。
XVE矢量引擎除了救助SIMD16/SIMD32,还救助矩阵推广,包括INT2、INT4、INT8、FP16、BF16、TF32等数据类型,其中TF32是针对AI优化的数据体式还推广了Math、FP64救助。
另外,它还救助三路并发,包括FP、INT/EM、XMX,提醒鼎新和实践着力更高。
对比初代,XVE引擎当今更工整(基本不错视为砍半),应该也会更机动。
光追部分,Intel也作念了大刀阔斧地改造,合座结构没太大变化,然而鸿沟和性能高得多,比如遍历活水线从2条增至3条、方盒相交增大1.5倍、三角形相交增大2倍、BVH(包围盒头绪结构)缓存增大2倍来到16KB。
这么的鸿沟天然远远没法和NVIDIA比拟,以至不如AMD,但升迁亦然特殊显然的,应该或者达到基本可用的水平,天然更有赖于游戏的适配和优化。
媒体引擎包含两个相通的多媒体解码器(MFX),但阻挠它和Lunar Lake里集成的核显媒体引擎略有不同,莫得XMX硬件编解码单元,因此不救助VVC(H.266)硬解码。
这即是BMG-G21,二代锐炫显卡首发的GPU中枢芯片。
它统共有5个渲染切片、20个Xe2中枢、20个光追单元、160个XMX引擎、20个纹理采样器、10个像素后端,以及2个多体式X编解码器,还有多达18MB二级缓存、192位显存。
各家的GPU架构遐想不同,是以中枢鸿沟不具备径直可比性,但淌若将这些与NVIDIA GPU类比,那就特殊于80个ROP光栅单元、160个TMU纹理单元。
这是因为,纹理采样器转移为TMU的比例是1:8,像素后端与ROP的转移比例相同是1:8。
按照Intel的首发,经过优化的第二代Xe中枢,性能提高了70%,能效提高了50%。
而在一组微基准测试中,性能升迁幅度最高可达惊东说念主的12.5倍。
比如在《堡垒之夜》中,上图白线代表锐炫A系列,蓝线代表锐炫B系列,单元是毫秒,时辰则越短越好。
锐炫A系列实践一帧渲染的时辰为19.33毫秒,锐炫B系列则裁减到了13.01毫秒。
重要是,每一个渲染才气的着力皆更高了,比如径直实践检朴了1.1毫秒,转折实践检朴了1.5毫秒等。
这也就阐扬,锐炫B系列的每一个方位皆作念了微架构优化,皆不错检朴渲染时辰,从而升迁渲染着力和性能。
跟着图形本领的跳跃,单纯的渲染照旧不及以反应GPU策划能力,也无法作念到显贵升迁性能,AI渲染就越来越盛大。
XeSS即是Intel打造的AI超分惩办决议,对标NVIDIA DLSS、AMD FSR,在较低分辨率的画面帧的基础上,索取畅通矢量,使用超分辨率本领进行放大和加快,从而生成更高质料的图像。
官方堪称,在2K超高画质游戏中,XeSS不错带来22-80%的性能升迁,尤其是在光追等像素生成较为贫困的场景中着力更显然。
经过不停费力,Intel XeSS照旧有卓著150款游戏救助,初具鸿沟。
如今,XeSS终于升级为第二代,SR超分本领基础上加多了两项新本领:XeSS FG帧生成本领,升迁画面质料与帧率;XeLL低蔓延本领,升迁反应速率。
XeSS FG帧生成本领的责任旨趣是:发轫使用游戏引擎,原生渲染出第一帧和第二帧,然后通过插帧本领和AI算法,生成二者之间的中间帧并插入。
为了结束这一主意,Intel接纳了两种本领,辨认是光流重投影本领、畅通矢量重投影本领,二者连合以确保插帧的准确性、画面的畅通性。
不外不同于NVIDIA RTX 40系列,Intel不需要单独的光流加快器硬件,至于是否救助NVIDIA、AMD的显卡还在评估。
目下暂时还莫得救助XeSS FG帧生成的游戏,毕竟刚刚文书,然而《F1 24》等游戏照旧在积极开发集成,UE等游戏引擎也不错通过插件救助。
天然,XeSS SR超分、XeSS FG帧生成两项本领亦然不错一说念使用的。
XeSS SR渲染一个稍低分辨率的画面帧,并将它放大,在送到XeSS FG插帧里,结束帧率翻倍。
比如《F1 24》,不错看到XeSS 2的性能升迁是相当显贵的,远超初代XeSS。
2K超高画质下,锐炫B580的基准帧率为48FPS,开启XeSS 2质料形状就能升迁至2.8倍,不但比初代XeSS高了卓著65%,以至卓著了XeSS SR超高性能形状。
步骤开启XeSS 2均衡形状、性能形状、超高性能形状,帧率还不错缓缓升迁,最终高达186FPS,是原素性能的果然4倍。
先容XeLL低蔓延本领之前,先追忆一下PC游戏中的系统蔓延何如来的。
这个过程始于玩家点击鼠方向四肢,一直握续到画面最终表示在屏幕上,这个过程所需要的时辰,即是咱们说的蔓延。
具体来说,玩家操作的信号发轫传递给CPU,随后进入一个称作渲染队伍的才气,然后GPU将这些提醒转移成屏幕上的像素,终末这些像素组成的图像呈当今表示器上。
扫数这个词经由中的每一步皆可能加多蔓延,蕴蓄起来即是咱们在游戏中感受到的卡顿局势。
为了尽可能数落蔓延,NVIDIA打造了Reflex本领,AMD则推出了两代Anti-Lag,当今轮到了Intel XeLL。
XeLL要点针对CPU渲染队伍恭候过程,基本扬弃了它,从而大大裁减了从鼠标点击到屏幕表示的扫数这个词过程。
Intel PresentMon器具照旧不错表示具体蔓延,简约玩家测量从鼠标输入到系统表示的扫数这个词蔓延时辰。
同期,Intel里面还开发了蔓延测量器具(LMT),基于微纵脱器的一款特殊招引。
实质性能怎么呢?照旧以《F1 24》为例。
原生渲染时,48FPS帧率的蔓延是57毫秒,而在开启XeLL之后,蔓延数落到了32毫秒,改善了多达45%。
更神奇的是,淌若把XeSS SR、FG、XeLL低蔓延全部掀开,不错把蔓延降至28毫秒,改善51%,同期帧率高达152FPS,升迁2.17倍。
天然,也不错只开启SR、低蔓延,此时蔓延仅有19ms,改善足有67%,而帧率为90FPS,仍有原生渲染的接近2倍。
XeLL低蔓延本领是基于驱动法式结束的,因此着力不是最好的,但很容易集成到游戏中。
首发救助的有《F1 24》、《漫威暗夜之子》、《刺客信条:幻景》等等,将来还会有更多加入。
AI,尤其是生成式AI,是如今GPU绕不开的话题,锐炫B系列也通过增强的XMX引擎,提供了更好的救助。
锐炫B580对比RTX 4060,脱手常见的Llama 2、Llama 3.1、Mistral、Phi-3等大型谈话模子,皆有特殊大的性能上风,最多最初约50%。
Intel之前还推出了一个免费的生成式AI器具AI Playground 2.0,专为Xe2架构而来(包括核显)。
它允许用户在腹地端侧体验图像创建、剪辑、AI对话等,下载模子即可体验,无需联贯云霄。
好的显卡,除了好的硬件架构本领,更离不开好的驱动,Intel也在握续完善,功能不停丰富,无论是图形诞生、3D诞生,照旧超频,该有的皆有。
说到超频,锐炫B系列天然也不错,况且更粗略,在驱动中开启高等形状即可操作。
上图中,浅蓝色表示的是默许频率和电压弧线,玩家不错朝上鼓舞该弧线,从而升迁频率,得到更高的性能。
玩家还不错使用电压偏移来更正电压,并看望更多电压点,这一切皆及时可见。
电压、功耗皆不错诞生一定的最高阈值,确保安全超频。
以锐炫B580为例,默许景象下即可简约超频200MHz;加多20%功耗不错再超200MHz;赓续加多25%电压还能赓续超200MHz。
天然,具体超频幅度和电压、功耗诞生,取决于显卡的不同个体体质,以及散热等外部身分。