1.一种重复性视频音频节目片段的检测方法,其特征在于,包括下列步骤:步骤A,将待检测的视频音频节目片段中的音频流进行分割得到音频流片段,并从每一音频流片段中提取音频特征;步骤B,在视频音频节目流中,利用欧氏距离作为粗粒度相似性匹配的距离测度检测与音频流片段匹配的具有重复性的视频音频节目片段的音频序列,得到重复性视频音频节目片段;步骤C,对步骤B中初步得到的重复性视频音频节目片段,利用改进式的欧氏距离D2作为细粒度相似性匹配的距离测度重新测定重复性视频音频节目片段的起始和结束时间点, D 2 = Σ n = 1 N | a n - b n | ]]> 其中N为14维的帧特征参数,对于每一对找到的匹配片段对,把它们标记为A2和B2,分别计算A2B2、A2B1、A1B2、A1B1、A2B3、A3B2、A3B3逐帧的改进式欧氏距离,得到距离矩阵后通过和预先设定好的匹配阈值TD进行比较,分别记下小于阈值TD的点的位置,精确地定位重复性视频音频节目片段的开始和结束的时间;步骤D,对步骤C中精确地定位的重复性视频音频节目片段,使用基于序列的方法对匹配对进行合并,得到完整的重复性视频音频节目片段。
2.根据权利要求1所述的重复性视频音频节目片段的检测方法,其特征在于,所述步骤A包括下列步骤:步骤A1,将待检测的视频音频节目片段中的音频流分割为多个音频流片段,每个音频流片段为以一时间单元为一个单位进行标记;步骤A2,从音频流片段中提取音频特征参数。
3.根据权利要求2所述的重复性视频音频节目片段的检测方法,其特征在于,所述音频特征参数包括美尔倒谱系数,过零率和短时能量中一个参数或者一个以上的参数组合。
4.根据权利要求3所述的重复性视频音频节目片段的检测方法,其特征在于,所述提取美尔倒谱系数,过零率和短时能量,包括下列步骤:以40ms采集的音频数据量为一帧,相邻音频帧没有重复,提取12个美尔倒谱系数、过零率和短时能量共14个参数,来构成14维的帧特征参数。
5.根据权利要求1所述的重复性视频音频节目片段的检测方法,其特征在于,所述利用欧氏距离作为粗粒度相似性匹配的距离测度,包括下列步骤:利用欧氏距离作为粗粒度相似性匹配的距离测度找到所有和音频流片段匹配的具有重复性的视频音频节目小片段,并规定两个小片段中重复的部分大于一半才为匹配片段序列。
6.根据权利要求1所述的重复性视频音频节目片段的检测方法,其特征在于,所述利用欧氏距离作为粗粒度相似性匹配的距离测度,采用的方法是每隔10帧计算帧级欧氏距离D1: D 1 = Σ n = 1 N ( a n - b n ) 2 ]]> 其中N为14维的帧特征参数,得到距离矩阵后通过和预先设定好的匹配阈值TD进行比较,如果存在7个或以上帧数小于预先设定好的匹配阈值TD,就认为该视频音频节目片段是与音频流片段匹配的具有重复性的视频音频节目片段的音频序列。
7.根据权利要求1所述的重复性视频音频节目片段的检测方法,其特征在于,所述步骤D中,对匹配对进行合并,包括下列步骤:对于检测匹配到的每一对精确匹配的重复性视频音频节目片段,分别查找和它们的时间间隔小于预先设定好的阈值TT的所有匹配对,把新找到的匹配对和原来的匹配对进行连接,然后再次的重复检测匹配过程,直到没有满足条件的匹配对存在,得到的新的匹配对的开始和结束时间就是一个完整的重复性视频音频节目片段的起始和结束时间。
8.一种重复性视频音频节目片段的检测系统,其特征在于,包括:音频处理模块,用于将待检测的视频音频节目片段中的音频流进行分割得到音频流片段,并从每一音频流片段中提取音频特征;检测匹配模块,用于利用欧氏距离作为粗粒度相似性匹配的距离测度,在视频音频节目流中检测与音频流片段匹配的具有重复性的视频音频节目片段的音频序列,初步得到重复性视频音频节目片段;第二匹配模块,用于对检测匹配模块中初步得到的重复性视频音频节目片段,利用改进式的欧氏距离D2作为细粒度相似性匹配的距离测度重新测定重复性视频音频节目片段的起始和结束时间点, D 2 = Σ n = 1 N | a n - b n | ]]> 其中N为14维的帧特征参数,对于每一对找到的匹配片段对,把它们标记为A2和B2,分别计算A2B2、A2B1、A1B2、A1B1、A2B3、A3B2、A3B3逐帧的改进式欧氏距离,得到距离矩阵后通过和预先设定好的匹配阈值TD进行比较,分别记下小于阈值TD的点的位置,精确地定位重复性视频音频节目片段的开始和结束的时间;合并模块,用于对第二匹配模块中精确地定位的重复性视频音频节目片段,使用基于序列的方法对匹配对进行合并,得到完整的重复性视频音频节目片段。
9.根据权利要求8所述的重复性视频音频节目片段的检测系统,所述音频特征包括美尔倒谱系数,过零率和短时能量中一个参数或者一个以上的组合。
展开