英特尔Tom Petersen访谈 DeepLink+AV1编解码驱动GPU技术创新

ZOL中关村在线

2022-04-06

2022年3月底，英特尔发布了首款锐炫A系列移动级独立显卡，这是英特尔重返高性能GPU领域打响的第一枪。在众多全新特性里，Deep Link技术与对AV1编解码技术的支持，是锐炫A系列GPU颇为与众不同的地方。

虽然此前我们已经通过《英特尔锐炫移动级独立显卡解析：剑指高性能GPU领域》一文对相关特性做了较为深入的解读，但其实在英特尔发布锐炫系列显卡当天早些时候，我们就Deep Link与对AV1编解码技术的相关问题采访了英特尔院士Tom Petersen先生。相信通过Tom Petersen的解读，对于Deep Link以及锐炫显卡对AV1编解码技术的支持会有一个更为系统的了解。

受访嘉宾：Tom Petersen，英特尔院士（主要负责图形创新）

简单来说，Deep Link是锐炫GPU多种技术的总称，目前包含动态功率共享，超级编码和超级算力三大主要技术。但是随着应用需求发展与技术创新演变，TomPetersen表示英特尔将持续开发更多技术，并将其纳入Deep Link所代表的技术组合中。

TomPetersen认为：“Deep Link最令人兴奋的一点，就是可以让英特尔的不同IP实现协作。所以，如果我们发现有某一个CPU功能可以与GPU进行配合，我们肯定会探索两者协作的可能。我们会尽最大努力快速拓展Deep Link中的技术组合。”

Deep Link包含三大技术，其中动态功率共享可以通过监测CPU与GPU任务负载状态来动态分配二者的功率，可以在保证性能体验的同时，最大限度节约功耗。动态功率共享是一项自动实现的功能。而且OEM厂商拥有调试权限，可以根据自身系统设计来进行设置。未来，每一台搭载锐炫独立显卡的笔记本电脑都将会支持这个功能。

支持动态功率共享的笔记本电脑都会始终保持该技术处于开启状态。它的工作原理是通过监控GPU和CPU利用率，以此了解相关工作负载情况，然后根据利用率情况，把相关功率调整到存在性能瓶颈的计算单元上。如发现CPU或GPU存在瓶颈，就会把更多功率调度给CPU或GPU，由此获得更好的整体性能。

不过TomPetersen也表示，“坦白讲，我们这项技术目前处于初始阶段。功率共享的理念是正确的，我们会基于这一理念持续进行创新，未来也希望将AI应用于该技术上。比如，我们可以通过实时推理，高效地判断我们应该往芯片上的哪个模块发送功率。我们将可以看到更多的参数，收集来自整个系统的不同信息，然后实时做出这些决定。这个过程不仅复杂程度高，做出决定的频率也更为频繁。当前，该技术做决定的周期循环速度能达到100毫秒。我们想进一步加快这个频率，因为系统在极短时间内就发生很多变化。如果我们能更为迅速地调整功率，在发现瓶颈的瞬间将功率输送到合适的位置，这绝对将会是一项绝佳能力。所以，在动态功率分享这个功能上，我们刚迈出第一步，这仅仅是个开始，这是个非常出色的技术。”

英特尔12代酷睿引入了异构混合架构，性能核与能效核的线程调度是否会影响到动态功率共享的效率呢？

事实上，性能核与能效核两者之间平衡目前与动态功率共享关联不大，但是TomPetersen认为在一些工作负载下，如果通过显卡驱动调度性能核或者能效核来运行这项工作负载，之后将节省下来的功率用来运行图形工作负载，或许是一个非常不错的想法。虽然目前初始阶段还未囊括到系统运行范畴，但未来对“在性能核还是能效核运行工作负载”的判断，可能会被加入到动态功率共享技术的算法中。

在目前的技术框架下，Deep Link所包含的三大技术特性，似乎更多是为生产力而服务的，也就是说内容创作、办公生产力用户会从中获得更多直观的体验。但英特尔锐炫GPU显然不止于此，它的目标同样包含了游戏用户。但为何Deep Link现阶段所展现出来的主要是针对生产力的技术特性呢？

对此问题，TomPetersen给出了确切答复：“Deep Link技术目前还处在初始阶段。所以我们需要先从一些特定技术做起，这些技术大多与媒体处理有关的原因，是这些问题相对更容易解决。但是我们也期待将Deep Link技术应用到游戏中。举例来说，我们希望能在集成显卡运行AI算法，只在独立显卡上运行渲染，然后将它们组合起来。这在混合系统中特别有用。你会用独立显卡进行渲染，然后总会把图像复制到集成显卡，因为最终图像是从集成显卡输出的。所以我们希望能研发一些技术，把集成显卡变成一个图像增强引擎。这样就可以只渲染一次，然后在发送之前用集成显卡完成图像增强。但它的实现仍需要一些时间。现在我们的Deep Link技术主要针对那些使用媒体引擎制作多媒体内容的创作者。但其实这种技术非常适合游戏。虽然我们今天不会具体分享这方面的详细信息，但我们也有计划把Deep Link应用到游戏中。”

针对内容创作，Deep Link提供了一项非常重要的技术，那就是超级编码技术。根据工作负载不同，超级编码的优势也体现在不同方面。根据英特尔官方数据来看，与仅采用英特尔锐炬X^e显卡相比，超级编码让整个平台上的媒体引擎能够相互结合，从而将视频编码速度提高60%。结合集成显卡和独立显卡算力，通过合作编码，能够将性能提升大约60%。因此，使用搭载锐炫显卡的PC进行视频内容创作时，整体效率会有更好表现。

说到视频内容创作，英特尔锐炫显卡是业界率先提供AV1编解码技术的高性能GPU。针对AV1，英特尔采用了一个专门针对AV1编解码进行优化的硬件引擎，它可以在英特尔开发的编码和解码器模块中直接应用，而不会受到驱动等其它因素的影响。同时，在运行AV1编解码任务之前，也就是在其进入编解码模块之前，AI技术也会提供一些支持，虽然它并不与AV1编解码直接相关，但AI技术能够与AV1编解码一起工作，从而获得更好体验。

视频编解码方面，一直以来都是英特尔硬件平台的强项，英特尔也在不断制定和推动新的标准，但对于整个行业而言，AV1依旧是比较罕见的编解码标准，流媒体平台、直播行业都没有广泛应用。那么英特尔如何联合合作伙伴去推动AV1技术的普及呢？

对此，TomPetersen表示：“我们现在处于AV1的前沿，但与以前的编解码器相比，这项技术明显有着巨大优势。英特尔会一如既往探索和创新，我们会把AV1集成到我们的独立显卡中，未来会集成到更多集成显卡中。随着相关设备的保有量达到百万级别，生态系统就会开始跟进，这就是英特尔技术一直的运作方式。在我们当初做USB时，市面上还没有USB设备。当我们做Wi-Fi时，也没有Wi-Fi设备。对于现在的AV1，也需要一定的时间，谷歌、亚马逊、Twitch等服务商才会接受AV1内容。至于AV1直播，会需要更长的时间。事实是，这些都需要长期的过程。我们致力于长期推广AV1。最终，它会让所有人受益，因为它能让视频直播的质量更高。AV1是开放的规范，开放的编解码器。英特尔并不收取授权费。我们要做的是推动整个生态系统拥抱AV1这么好的技术。”

AV1编解码技术的普及，更为重要的一点是软件生态支持。TomPetersen认为，“AV1的普及在很大程度上取决于软件生态系统。”英特尔已经开发了支持AV1编解码的硬件，而且正在与关键生态系统软件提供商合作，如DaVinci、Adobe Premier、HandBrake等等。他们已经采用和集成了锐炫AV1编码，并将在搭载锐炫显卡的产品上市时就会第一时间支持。

但TomPetersen也表示，“这仅仅是开始。在AV1成为主流编解码器之前，还需要很多人做很多事情，需要很长时间。我们相信，AV1的好处是巨大的。这项技术经过验证，生态系统采用它只是时间问题。虽然一些应用软件在现在已经支持它了，但我们在软件支持方面依旧会继续努力，我们也相信越来越多企业和用户将能够感受到AV1的优势。”

与时下比较普及的H.265相比，AV1的优势在于整体成本节约。其效率比H.265高约30%，并且占用带宽更低，这可以为YouTube、Twitch等大型服务提供商降低带宽管线成本。而且随着更加广泛地部署AV1编解码器以及相关硬件和软件，更多生态系统也会广泛采用它。

·结语

在多年两强相争局面下，英特尔借助锐炫GPU重新入局高性能GPU领域，这势必会对传统GPU市场造成巨大冲击。虽然更高性能的锐炫5、锐炫7显卡要等到夏季才会发布，但锐炫3已经展现出了诸多英特尔独有的新特性，未来三强相争格局稳固之后，用户无疑会是最大的受益者之一，让我们拭目以待！

继续阅读(剩余50%)

查看全文