基于H.264/AVC压缩域的实时视频镜头分割算法


龙源期刊网 http://www.qikan.com.cn 基于H.264/AVC压缩域的实时视频 镜头分割算法 作者:洪夏俊 夏殿松 来源:《电脑知识与技术》2009 年第 04 期 摘要:随着 H.264/AVC 压缩标准得到越来越广泛的应用,基于 H.264/AVC 压缩域的视频 镜头分割技术成为视频检索领域的热点问题。根据镜头边缘处前后帧的相关性较低的特征,统 计帧在总体上的宏块预测模式信息来获取视频的候选镜头边界集,然后利用局部特性对其进行 筛选,得出了镜头边界,并通过实验进行验证,实验结果证明,本算法是快速有效的。 关键词:镜头分割;宏块;预测模式;H.264/AVC 中图分类号:TP37 文献标识码:A 文章编号:1009-3044(2009)04-0944-03 Scene Change Detection Algorithms in H.264/AVC Compressed Domain HONG Xia-jun, XIA Dian-song (Department of Electronic Information Engineering ICE, PLAUST, Nanjing 210007, China) Abstract: Along with widely using of H.264/AVC, the scene change detection in H.264/AVC compressed domain becomes a hot issue in Context-Based Video Retrieval field. Base on the character that there is less temporal correlation between frames where scene change occurs, according to different macro-block prediction mode in the whole frame, the proposed algorithms obtain candidates of scene change frames. To find accurate scene changes, we use the part characteristic of the fame. The experimental results shows that the proposal algorithm is fast and efficient. Key words: scene change detection; macro-block; prediction mode; H.264/AVC 1 引言 多媒体技术和 Internet 的发展给人们带来巨大的多媒体信息海洋,并进一步导致了超大型 多媒体信息库的产生,仅仅凭关键词是很难做到对多媒体信息的描述和检索的,这就需要有一 种针对多媒体的有效检索方式。如何有效的帮助人们快速、准确地找到所需要的多媒体信息, 成为多媒体信息库所要解决的核心问题。基于内容的视频检索(Content-Based Video Retrieval)是一种新的检索技术,是对多媒体视频对象的内容及上下文语义环境进行检索,如 对视频中的场景、片断进行分析和特征提取,并基于这些特征进行相似性匹配。 基于内容的视频信息检索是当前多媒体数据库发展的一个重要研究领域,它以视频镜头分 割作为第一个步骤,将连续的视频流划分为具有特定语义的视频片段——镜头,作为检索的基 龙源期刊网 http://www.qikan.com.cn 本单元。现有的视频都是以压缩格式储存的,广泛应用的压缩标准有 MEPG-2,MPEG-4, H.264/AVC 等。然而,为了实现镜头分割,传统方法需要将压缩格式的视频解压缩,这是一个 十分耗时的过程,无法满足一些实时的需求。为了解决这个问题,学者们做了很多在压缩域进 行镜头分割的研究。例如,MPEG-2 压缩域的镜头分割方法有基于 DC 系数的[1],运动向量的 [2],比特率控制的[3]等等。然而 H.264/AVC 的一些新特性,如支持多种大小的宏块分割、多 参考帧等,使得这些基于 MPEG-2 的分割算法不再适用于 H.264/AVC 的压缩视频。 近几年来,因为 H.264/AVC 更高的压缩比和良好的网络亲和性,它正被越来越广泛的运 用于各类视频压缩中。因而基于 H.264/AVC 压缩域的视频分割技术受到了空前的重视,很多 学者根据 H.264/AVC 的特性,提出了许多有效的算法:Sungmin 等人在[4]中提出了一种比较 两个连续的 I 帧的宏块分割模式来判断镜头边界的算法,这种算法运行速度十分快,充分体现 了压缩域镜头分割算法的优点,有着较高的精度,而且对于检测镜头渐变切换也有着不错的效 果,但是也有一个重要的缺陷,它只能将镜头边界确定在两个 I 帧之间,而无法精确到具体的 某一帧。 发生镜头切换的帧与前面的帧的差异比较大,势必将大量的采用帧内编码模式,根据这种 特点本文提出了一种改进型的算法,并通过实验进行了验证。 2 基于宏块预测方式的镜头分割算法 2.1 原理分析 H.264/AVC 中,一个编码图像(即一帧)通常划分成若干个宏块,一个宏块由一个 16*16 的亮度像素和附加的一个 8*8Cb 和一个 8*8Cr 彩色像素快组成。每个图像中,若干宏块被排列 成片的形式。 I 片只包含 I 宏块,P 片可包含 P 和 I 宏块,而 B 片可以包含 B 和 I 宏块。I 宏块利用从当 前片中已解码的像素作为参考进行帧内预测,P 宏块利用前面已编码的图像作为参考图像进行 预测,B 宏块则利用双向的参考图象进行预测。H.264 的基本档次中只利用了 I 片和 P 片,主 要用于可视电话、会议电视、无线通信等实时视频通信中。 当镜头发生切换发生在第 i 帧时,i

相关文档

基于H.264压缩域的实时运动对象分割算法
基于DCE算法的压缩域视频镜头分割方法
基于蚁群聚类算法的H.264压缩域运动目标分割
基于自动镜头分割的视频压缩编码算法
一种压缩域中基于镜头的视频检索方法
电脑版