测试设备:
硬件:Intel® Core™ i5-7200U 2.5GHzx4, HD Graphics 620 (KBL GT2), MEM: 8G DDR4软件版本:Linux 18.04.4 LTS, OpenVINO 2020.3,FFmpeg 4.3.1, LibVA: 2.1.0, VA-API version 1.6.0
测试日期:2021.7.30
Demo 1:OpenVINO Obeject_detection_async_ssd 官 方demo(CPU 解码 +iGPU 推理 ):

本文优化后的 Demo2:零拷贝方案 Obeject_detection sample(iGPU 解码 +iGPU 推理 ):


在传统视频处理流程中,CPU 承担了视频解码以及视频缩放的任务,这使得 CPU 在工作中负载大,并且使与 CPU 通信的带宽比较拥挤。本文方案利用Intel® CPU所包含强大的iGPU 芯片,将解码与缩放的任务置于 iGPU 中完成,并且构建 Remote Blob 使硬件缩放的数据能够零消耗地读入 iGPU Plugin 进行推理。
本文通过使用 FFmpeg 调用 VAAPI 的 LibVA 作为解码后端和缩放后端,解码产生的数据存储在 iGPU 的缓存中,利用硬解参数 VASurefaceID 和 VADisplay 构建 Remote Blob,使得iGPU Plugin 在推理的时候可以直接获取 iGPU 缓存中这些格式为 NV12 的图像数据。通过结果的数据分析比对,经过优化的方案前处理所消耗的时间更少,解码与缩放操作从 CPU 转到 iGPU 中,通过 Remote Blob 使 iGPU Plugin 推理时能直接获取解码缩放数据,减少了 CPU 与 iGPU 间不必要的数据拷贝,使得 CPU 的负载明显降低了。整个视频处理流程运行在 iGPU 上,可以很好地降低带宽负载并且降低 CPU 负载,能够让整个应用程序更加轻盈,性能更好。
本文代码地址 & 环境安装手册:
https://github.com/intel-iot-devkit/ffmpeg-VAAPI-OpenVINO
Notices & Disclaimers
Performance varies by use, configuration and other factors. Learn more at www.Intel.com/PerformanceIndex Performance results are based on testing as of dates shown in configurations and may not reflect all publicly available updates. See backup for configuration details.No product or component can be absolutely secure.
See backup for configuration details. For more complete information about performance and be nchmark results, visit www.intel.com/benchmarks�
- Tiger Lake Performance: https://www.anandtech.com/show/16063/intel-launches- 11th-gen-core-tiger-lake-processors-and-evo-branding
- LibVA 文档 : https://www.freedesktop.org/wiki/Software/vaapi/
- FFmpeg 文档: https://ffmpeg.org/doxygen/3.2/files.html
- OpenVINO™文档 : https://docs.openvinotoolkit.org/latest/
- OpenVINO™ RemoteBlob 资料: https://docs.openvinotoolkit. org/latest/openvino_docs_IE_DG_supported_Plugins_IGPU_ RemoteBlob_API.html
概述在视频处理流程中,视频的解码通常在 CPU 中进行,若用户需要使用集成显卡进行深度学习推理,解码数据需要从 CPU 的缓存中拷贝至集成显卡中进行推理。本文旨在通过集成显卡进行硬件解码,使用FFmpeg 集成 VAAPI 进行硬解码并使用滤镜进行图像缩放以及使用OpenVINO™ 的 Remote Blob 来避免解码后数据在集成显卡与 CPU之间的拷贝,最终将视频处理全流程部署在集成显卡中,实现图像数据传输零拷贝的方案。1. 背景介绍在日新月异的市场环境下,AI 技术不论是在工业界还是在学术界.