英特尔Tom Petersen访谈 DeepLink+AV1编解码驱动GPU技术创新

ZOL中关村在线
2022-04-06

2022年3月底,英特尔发布了首款锐炫A系列移动级独立显卡,这是英特尔重返高性能GPU领域打响的第一枪。在众多全新特性里,Deep Link技术与对AV1编解码技术的支持,是锐炫A系列GPU颇为与众不同的地方。

虽然此前我们已经通过《英特尔锐炫移动级独立显卡解析:剑指高性能GPU领域》一文对相关特性做了较为深入的解读,但其实在英特尔发布锐炫系列显卡当天早些时候,我们就Deep Link与对AV1编解码技术的相关问题采访了英特尔院士Tom Petersen先生。相信通过Tom Petersen的解读,对于Deep Link以及锐炫显卡对AV1编解码技术的支持会有一个更为系统的了解。

英特尔专访

受访嘉宾:Tom Petersen,英特尔院士(主要负责图形创新)

简单来说,Deep Link是锐炫GPU多种技术的总称,目前包含动态功率共享,超级编码和超级算力三大主要技术。但是随着应用需求发展与技术创新演变,TomPetersen表示英特尔将持续开发更多技术,并将其纳入Deep Link所代表的技术组合中。

TomPetersen认为:“Deep Link最令人兴奋的一点,就是可以让英特尔的不同IP实现协作。所以,如果我们发现有某一个CPU功能可以与GPU进行配合,我们肯定会探索两者协作的可能。我们会尽最大努力快速拓展Deep Link中的技术组合。”

Deep Link包含三大技术,其中动态功率共享可以通过监测CPU与GPU任务负载状态来动态分配二者的功率,可以在保证性能体验的同时,最大限度节约功耗。动态功率共享是一项自动实现的功能。而且OEM厂商拥有调试权限,可以根据自身系统设计来进行设置。未来,每一台搭载锐炫独立显卡的笔记本电脑都将会支持这个功能。

支持动态功率共享的笔记本电脑都会始终保持该技术处于开启状态。它的工作原理是通过监控GPU和CPU利用率,以此了解相关工作负载情况,然后根据利用率情况,把相关功率调整到存在性能瓶颈的计算单元上。如发现CPU或GPU存在瓶颈,就会把更多功率调度给CPU或GPU,由此获得更好的整体性能。

不过TomPetersen也表示,“坦白讲,我们这项技术目前处于初始阶段。功率共享的理念是正确的,我们会基于这一理念持续进行创新,未来也希望将AI应用于该技术上。比如,我们可以通过实时推理,高效地判断我们应该往芯片上的哪个模块发送功率。我们将可以看到更多的参数,收集来自整个系统的不同信息,然后实时做出这些决定。这个过程不仅复杂程度高,做出决定的频率也更为频繁。当前,该技术做决定的周期循环速度能达到100毫秒。我们想进一步加快这个频率,因为系统在极短时间内就发生很多变化。如果我们能更为迅速地调整功率,在发现瓶颈的瞬间将功率输送到合适的位置,这绝对将会是一项绝佳能力。所以,在动态功率分享这个功能上,我们刚迈出第一步,这仅仅是个开始,这是个非常出色的技术。”

英特尔12代酷睿引入了异构混合架构,性能核与能效核的线程调度是否会影响到动态功率共享的效率呢?

事实上,性能核与能效核两者之间平衡目前与动态功率共享关联不大,但是TomPetersen认为在一些工作负载下,如果通过显卡驱动调度性能核或者能效核来运行这项工作负载,之后将节省下来的功率用来运行图形工作负载,或许是一个非常不错的想法。虽然目前初始阶段还未囊括到系统运行范畴,但未来对“在性能核还是能效核运行工作负载”的判断,可能会被加入到动态功率共享技术的算法中。

在目前的技术框架下,Deep Link所包含的三大技术特性,似乎更多是为生产力而服务的,也就是说内容创作、办公生产力用户会从中获得更多直观的体验。但英特尔锐炫GPU显然不止于此,它的目标同样包含了游戏用户。但为何Deep Link现阶段所展现出来的主要是针对生产力的技术特性呢?

对此问题,TomPetersen给出了确切答复:“Deep Link技术目前还处在初始阶段。所以我们需要先从一些特定技术做起,这些技术大多与媒体处理有关的原因,是这些问题相对更容易解决。但是我们也期待将Deep Link技术应用到游戏中。举例来说,我们希望能在集成显卡运行AI算法,只在独立显卡上运行渲染,然后将它们组合起来。这在混合系统中特别有用。你会用独立显卡进行渲染,然后总会把图像复制到集成显卡,因为最终图像是从集成显卡输出的。所以我们希望能研发一些技术,把集成显卡变成一个图像增强引擎。这样就可以只渲染一次,然后在发送之前用集成显卡完成图像增强。但它的实现仍需要一些时间。现在我们的Deep Link技术主要针对那些使用媒体引擎制作多媒体内容的创作者。但其实这种技术非常适合游戏。虽然我们今天不会具体分享这方面的详细信息,但我们也有计划把Deep Link应用到游戏中。”

针对内容创作,Deep Link提供了一项非常重要的技术,那就是超级编码技术。根据工作负载不同,超级编码的优势也体现在不同方面。根据英特尔官方数据来看,与仅采用英特尔锐炬Xe显卡相比,超级编码让整个平台上的媒体引擎能够相互结合,从而将视频编码速度提高60%。结合集成显卡和独立显卡算力,通过合作编码,能够将性能提升大约60%。因此,使用搭载锐炫显卡的PC进行视频内容创作时,整体效率会有更好表现。

说到视频内容创作,英特尔锐炫显卡是业界率先提供AV1编解码技术的高性能GPU。针对AV1,英特尔采用了一个专门针对AV1编解码进行优化的硬件引擎,它可以在英特尔开发的编码和解码器模块中直接应用,而不会受到驱动等其它因素的影响。同时,在运行AV1编解码任务之前,也就是在其进入编解码模块之前,AI技术也会提供一些支持,虽然它并不与AV1编解码直接相关,但AI技术能够与AV1编解码一起工作,从而获得更好体验。

视频编解码方面,一直以来都是英特尔硬件平台的强项,英特尔也在不断制定和推动新的标准,但对于整个行业而言,AV1依旧是比较罕见的编解码标准,流媒体平台、直播行业都没有广泛应用。那么英特尔如何联合合作伙伴去推动AV1技术的普及呢?

对此,TomPetersen表示:“我们现在处于AV1的前沿,但与以前的编解码器相比,这项技术明显有着巨大优势。英特尔会一如既往探索和创新,我们会把AV1集成到我们的独立显卡中,未来会集成到更多集成显卡中。随着相关设备的保有量达到百万级别,生态系统就会开始跟进,这就是英特尔技术一直的运作方式。在我们当初做USB时,市面上还没有USB设备。当我们做Wi-Fi时,也没有Wi-Fi设备。对于现在的AV1,也需要一定的时间,谷歌、亚马逊、Twitch等服务商才会接受AV1内容。至于AV1直播,会需要更长的时间。事实是,这些都需要长期的过程。我们致力于长期推广AV1。最终,它会让所有人受益,因为它能让视频直播的质量更高。AV1是开放的规范,开放的编解码器。英特尔并不收取授权费。我们要做的是推动整个生态系统拥抱AV1这么好的技术。”

AV1编解码技术的普及,更为重要的一点是软件生态支持。TomPetersen认为,“AV1的普及在很大程度上取决于软件生态系统。”英特尔已经开发了支持AV1编解码的硬件,而且正在与关键生态系统软件提供商合作,如DaVinci、Adobe Premier、HandBrake等等。他们已经采用和集成了锐炫AV1编码,并将在搭载锐炫显卡的产品上市时就会第一时间支持。

但TomPetersen也表示,“这仅仅是开始。在AV1成为主流编解码器之前,还需要很多人做很多事情,需要很长时间。我们相信,AV1的好处是巨大的。这项技术经过验证,生态系统采用它只是时间问题。虽然一些应用软件在现在已经支持它了,但我们在软件支持方面依旧会继续努力,我们也相信越来越多企业和用户将能够感受到AV1的优势。”

与时下比较普及的H.265相比,AV1的优势在于整体成本节约。其效率比H.265高约30%,并且占用带宽更低,这可以为YouTube、Twitch等大型服务提供商降低带宽管线成本。而且随着更加广泛地部署AV1编解码器以及相关硬件和软件,更多生态系统也会广泛采用它。

·结语

在多年两强相争局面下,英特尔借助锐炫GPU重新入局高性能GPU领域,这势必会对传统GPU市场造成巨大冲击。虽然更高性能的锐炫5、锐炫7显卡要等到夏季才会发布,但锐炫3已经展现出了诸多英特尔独有的新特性,未来三强相争格局稳固之后,用户无疑会是最大的受益者之一,让我们拭目以待!

继续阅读(剩余50%)
查看全文
我要举报