视频加速器有用吗 可以让视频加速的软件

视频加速器有用吗,可以让视频加速的软件 。欲强网带你了解更多相关信息 。
视频是互联网应用中占比最大的数据类型 。智慧城市、视频直播、短视频、线上会议、VR、云游戏、视频AI分析等视频相关应用近期获得了迅猛发展,在这些应用场景中对视频的处理效率直接关系到用户体验 。如何获得高品质、高性能、低功耗的智能视频处理成为了目前业界关注的热点技术 。
视频是以单一格式创建和上传的,但最终以不同的分辨率在不同的终端设备上播放,需要将原视频解码、后处理、再编码,这一过程称为转码 。同时,还需要根据不同应用场景的需求对视频进行各种处理,如视频缩放、视频图像增强、视频增加广告/字幕/水印/台标、视频拼接等 。随着视频处理需求激增,视频业务成本快速上涨,各大视频业务服务厂商不得不在用户体验和资源成本之间做平衡 。
在这种情况下VPU应运而生 。VPU全称Video Processing Unit(视频处理单元),是专门面向AI场景优化设计的视频加速器,内置视频编码加速专用功能模块,具有高性能、低功耗、低延时等特性,为视频行业应用带来高效能的加速计算 。目前已有多家厂商宣布了VPU的开发计划 。Google近期宣布了一款名为Argos的视频芯片(VCU)并将其大规模用于YouTube的视频转码处理任务中 。在国内,浪潮前不久发布了AI视频处理加速器M10A 。浪潮M10A在8W超低功耗下可以实现16路1080P全高清视频处理加速,支持H.264、H.265、VP9等多种视频格式,兼容PCIE的服务器,为广泛的互联网视频厂商提供计算支撑 。

视频加速器有用吗 可以让视频加速的软件

文章插图
浪潮M10A加速卡
M10A系统架构
M10A板卡的系统架构设计兼顾了稳定的数据流程和完善的控制流程 。VPU芯片是整张板卡的数据处理核心单元,视频数据的解码、编码、转码、后处理等功能都是在VPU芯片中完成的 。为了与服务器BMC控制系统进行连接,M10A板卡上设计了单独的板级BMC管理芯片,完成板卡状态收集和控制,包括温度、功耗、告警、输出复位等 。从服务器BMC的控制界面中,可以获取M10A板卡的状态和控制等操作,这是M10A产品相比同类产品的显著优势 。
M10A板卡在完成视频转码的过程中,仅需要输入原始视频就可以得到最终重新编码的视频,在整个转码的过程中不需要CPU数据面的参与,从而减少HOST主机CPU的性能消耗,降低转码延时 。

视频加速器有用吗 可以让视频加速的软件

文章插图
M10A加速卡架构图
M10A智能视频处理加速器处于视频业务流程中的核心位置 。如下图所示,在数据中心,M10A搭载服务器组成高密度、低功耗、低成本的视频处理专用服务器,进而组建数据中心视频处理加速集群 。视频输入源完成视频数据采集后,通过网络传输到数据中心视频处理加速集群中,M10A完成视频流的解码、后处理工作,比如对视频YUV原始数据进行缩放和裁剪操作,最后完成高质量的视频编码,通过CDN分发给最终观看者 。
M10A除了完成支持传统视频转码操作外,还针对互联网视频的需求特点,研发了多播模式,针对输入视频进行衍生操作,最多可以支持1路视频衍生4路视频的操作,每路输入视频单独调整帧格式、分辨率等属性 。

视频加速器有用吗 可以让视频加速的软件

文章插图
M10A核心技术
无状态设计
无论是解码核心还是编码核心,浪潮M10A在开发中均采用了无状态设计思想 。软件通过操作一系列控制寄存器来管理编解码核心 。所有的输入和输出,比如待解码帧、参考帧、运动向量都存储在设备DRAM中 。编解码核心不会保存编解码的状态,当编解码核心处理完一路视频流的某一帧后,随时可以切换到其它路视频流进行处理 。这样编解码核心的调度管理将变的十分简洁,软件可以派发任务到任意一个空闲的编解码核,随着编解码核心的频率提升,可处理视频路数也将以接近线性的方式提升 。这种上下文切换的消耗相较于编解码一帧来说几乎是忽略不计的 。可能对于摄像头等某些边缘嵌入式设备来说,在帧间处理时保留状态是一种十分简洁的设计 。但是就大型数据中心来说,它们要处理成千上万不同分辨率、不同码率的视频流,无状态设计将是一种更友好、更高性能的选择 。
主观画质优化
浪潮M10A是目前市面上首款支持窄带高清技术的视频转码加速卡 。窄带高清技术的目标是在标准编码内核的基础上,在降低码率的同时保持主观质量不下降 。那它是如何做到的呢?现有视频编码是基于香农定理,它的率失真模型都是连续的,但是人眼视觉模型是阶梯性非连续的,因而在这个阶梯上存在一个降码率的空间 。

推荐阅读