您现在的位置: 首页 > 技术转让 > 一种基于Gabor特征空间的视频染色方法
一种基于Gabor特征空间的视频染色方法

一种基于Gabor特征空间的视频染色方法

  • 专利类型:发明专利
  • 有效期:2022-10-25至2024-10-25
  • 发布日期:2022-10-25
  • 技术成熟度:详情咨询
交易价格: ¥面议
  • 法律状态核实
  • 签署交易协议
  • 代办官方过户
  • 交易成功

专利推荐

  • 技术(专利)类型 发明专利
  • 申请号/专利号 201110326260  
  • 技术(专利)名称 一种基于Gabor特征空间的视频染色方法 
  • 项目单位
  • 发明人 盛斌 
  • 行业类别 人类生活必需品
  • 技术成熟度 详情咨询
  • 交易价格 ¥面议
  • 联系人 王女士
  • 发布时间 2022-10-25  
  • 01

    项目简介

    本发明公开了一种基于Gabor特征空间的视频染色方法。该方法首先利用视频的纹理特征构建旋转不变的Gabor滤波器和Gabor特征空间,然后生成视频的Gabor流并选取关键帧。染色时先对关键帧进行染色,再根据Gabor流的计算结果将关键帧的颜色在视频帧间传播。对于染色效果存在高误差的地方,用户可以通过交互操作对颜色进行修改。本发明的染色方法简单易用,适用于具有区域性纹理的各类视频数据,并可以在图形硬件GPU平台上完成,运行速度快。

    展开
  • 02

    说明书

    技术领域

    [0001] 本发明属于计算机算法、计算机图形技术、图象处理技术和纹理生成技术领域,具 体涉及一种基于Gabor特征空间的视频染色方法,可以用于电影动画及多媒体编辑等应用 领域。

    背景技术

    [0002] 图像染色技术是一种将单色灰度图像转换成彩色图像的处理技术。由于在染 色过程中图像的颜色信息由一维灰度信息增加为三维RGB彩色信息,这种信息的重建 通常都需要将用户对于灰度图像的解释和假设作为约束条件,通过优化的方法进行颜 色的恢复[A.Levin,D.Lischinski,andY.Weiss.Colorizationusingoptimization. ACMTrans.Graph.,vol. 23,no.3,pp.689-694,2004.]。有些染色方法以人工智能中的 样本学习为基础,通过对一系列彩色图像样本的学习,建立彩色与像素灰度值的映射关 系,以对灰度图象进行染色处理[T.Welsh,M.Ashikhmin,andK.Mueller.Transferring colortogreyscaleimages.ProceedingsofSIGGRAPH2002. 2002?pp. 277-280 ;Y. -W. Tai,J.Jia,andC. -K.Tang.Localcolortransferviaprobabilisticsegmentation byexpectation-maximization.ProceedingsofCVPR2005,2005,pp. 747-754 ;Q.Luan, F.Wen,D.Cohen-0r,L.Liang,Y. -Q.Xu,andH. -Y.Shum.Naturalimagecolorization. inRenderingTechniques2007.Eurographics,2007.]。最近 Irony等人提出的一种染色 方法[R.Irony,D. Cohen-0r,andD. Lischinski.Colorizationbyexample.Proceedings ofRenderingTechniques,2005,pp. 201-210.],可以仅针对一张彩色样本图像进行学 习就可有效地将颜色传播到指定的灰度图像上。随后,该方法被扩展来处理多幅灰度 图像[X.Liu,LWan,Y.Qu,T.-T.Wong,S.Lin,C.-S.Leung,andP.A.Heng,"Intrinsic colorization,''ACMTransactionsonGraphics(SIGGRAPHAsia2008issue),Vol. 27, N0.5,2008,pp. 152.]。还有一些染色技术以用户交互为辅助手段[Y.-C.Huang,Y.-S. Tung,J.-C.Chen,S.-W.Wang,andJ.-L.Wu,''Anadaptiveedgedetectionbased colorizationalgorithmanditsapplications,"ProceedingsofACMMultimedia, 2005?pp. 351-354 ;L.YatzivandG.Sapiro.Fastimageandvideocolorizationusing chrominanceblending.IEEETransactionsonImageProcessing,vol. 15,no. 5, pp. 1120-1129,2006 ;V.KonushinandV.Vezhnevets,"Interactiveimagecolorization andrecoloringbasedoncoupledmaplattices,"ProceedingsofGraphicon,vol. 4, 2006,pp. 231-234.],通过用户交互给灰度图像的特定区域直接着色,然后再将颜色扩散 传播到整个图像空间。Yatziv和Sapiro采用一种像素间颜色加权平均的方法进行颜色 扩散,其颜色加权的权值与像素间测地距离成正比。另外,贝叶斯纹理分类的方法也被 引入到航天航空灰度图像的染色中[U.Lipowezky.Grayscaleaerialandspaceimage colorizationusingtextureclassification.PatternRecognitionLetters,vol.27, no. 4,pp. 275-286, 2006.]。通过使用原型匹配,它能克服[T.Welsh,M.Ashikhmin,and K. Mueller. Transferring color to greyscale images. Proceedings of SIGGRAPH,2002, pp. 277-280.]所提出染色方法的缺点。

    [0003]在现有的染色方法中,光流算法[B. K. P. Horn and B. G. Schunck. Determining optical flow.Artif. Intell.,vol. 17,no. 1-3,pp. 185-203,1981 ;B.Lucas and T. Kanade. An iterative image registration technique with an application to stereo vision.International Joint Conference on Artificial Intelligence, vol.3?1981 ;D. Heeger. Optical flow using spatiotemporal filters. International Journal of Computer Vision,vol. 1,no.4,pp. 279-302,1988 ;R.MARCH. Computation of stereo disparity using regularization. Pattern recognition letters,vol. 8, no. 3,pp.181-187,1988 ;M. Black and P.Anandan. The Robust Estimation of Multiple Motions :Parametric and Piecewise-Smooth Flow Fields. COMPUTER VISION AND IMAGE UNDERSTANDING,vol.63,pp. 75-104,1996 ;L.Alvarez,R. Deriche,J. S ' anchez,and J. Weickert. Dense Disparity Map Estimation Respecting Image Discontinuities :A PDE and Scale-Space Based Approach. Journal of Visual Communication and Image Representation,vol. 13,no. 1-2,pp. 3-21,2002 ;T.Brox,A. Bruhn,N.Papenberg,and J. Weickert. High Accuracy Optical Flow Estimation Based on a Theory forWarping. LECTURE NOTES IN COMPUTER SCIENCE,pp.25-36,2004.]是对视频图像间视差进行计 算的方法,适用于一般视频序列的物体运动估计。但是,视频中场景结构的遮挡关系和 物体的不规则运动,使得光流的精确计算很困难。最近提出的VideoSnap技术[X.Bai, J.Wang,D. Simons,and G. Sapiro,"Video SnapCut :robust video obj ect cutout using localized classifiers,"in ACM SIGGRAPH 2009papers. ACM,2009,p. 70.]结合了图像分 类和高质量抠图技术,可得到高质量的光流结果。而SIFT流[C.Liu,J.Yuen,A.T 0iralba, J. Sivic,and W. Freeman,''SIFT flow :dense correspondence across different scenes,"in Proc. ECCV2008, 2008, pp. 28-42.]采用了更强大的像素运动跟踪算子,能够提 供更好的视频像素运动估计。

    [0004] 纹理特征提取可用于图像的分类、分块、合成以及形状提取等多种应用领域,通常 纹理特征的提取可以通过统计模型来表达[M.Galun,E. Sharon,R.Basri,and A. Brandt. Texture segmentation by multiscale aggregation of filter responses and shape elements, in Computer Vision? 2003. Proceedings. Ninth IEEE International Conference on,2003, pp. 716-723. 纹理特性一般包括大小,方向,亮度,纹元密度 等,这些基本特性在很多前人的方法中都有研究[B. Julesz. Textons,the elements of texture perception,and their interactions. Nature,vol.290,no.5802,pp. 91-97, 1981]。而对于纹理的分析最近也有了显著的提高,特别是利用统计方法来表达纹理特征 的一些方法,比如Gabor滤波器、滤波组、随机过程模型以及小波等[T. Weldon,W. Higgins, and D.Dunn,Efficient Gabor filter design for texture segmentation. Pattern Recognition,vol.29,no.12,pp.2005-2015,1996. E. Bruno and D. Pellerin,"Robust motion estimation using spatial gabor-like filters? ^ Signal Process.,vol. 82, no. 2,pp. 297-309, 2002.]。这些纹理特征的统计函数可被利用来进行纹理分类和图像分割 等。对于图像/视频染色技术而言,纹理特征的分析有助于将颜色从关键帧向其余帧进行 传播,传播的精度与误差都可以通过图像帧之间的纹理度量来计算。

    [0005]现有的染色方法中[A. Levin,D. Lischinski,and Y. Weiss,"Colorization using optimization," ACM Trans. Graph.,vol. 23,no.3,pp. 689-694,2004. Q. Luan,F. Wen, D.Cohen-0r, L.Liang, Y.-Q. Xu, and H.-Y. Shum,"Natural image colorization," in Rendering Techniques 2007. Eurographics,2007.],颜色之间的传播(帧间传播通过 光流)通常是在图像空间中按四/八连通的方式进行(一个像素有四/八-连通空间 的邻居)。这种固定颜色的传播模式通常需要比较多的用户交互工作,特别是对于自然 纹理分布比较密集的视频。由于这些视频中类似的色彩在分布上不一定连续,使用以前 的染色方法(比如优化的方式[A.Levin,D.Lischinski,and Y.Weiss,"Colorization using optimization," ACM Trans. Graph.,vol. 23,no. 3,pp. 689-694, 2004.],混合方式 [L.Yatziv and G. Sapiro,"Fast image and video colorization using chrominance blending," IEEE Transactions on Image Processing,vol.15,no. 5,pp.1120-1129, 2006.]),就需要用户指定每个区域的每一个细节的颜色,这对于视频染色来说,交互工作 量非常大。

    [0006] 在视频染色中,为了得到更逼真的染色效果,通常还需要对染色进行色彩的修 补,特别是针对一些细节比较复杂的视频和图像数据。为此,色彩传播计算要考虑帧间染 色传播的时间相关性,具体地,就是要测量颜色传播的误差。这方面一般是采用运动估计 的方法,但通常所采用的图像特征算子难以保证有效计算。比如SIFT (Scale-invariant feature transform),虽然具有健壮性的特点,但与视频染色的特点不相符合,难以用于颜 色的传播与跟踪。而对于 SIFT 流[C. Liu,J. Yuen,A. Torralba,J. Sivic,and W. Freeman, "SIFT flow :dense correspondence across different scenes,''in Proc. ECCV2008, 2008, pp. 28-42.]来说,其纹理特征检测更注重于纹理区域的特征点对比,因此,在应用于 具有自然场景的视频数据时,其纹理特征检测容易产生误差,影响自然景观的染色效果,因 为很多自然场景中的纹理通常表现为一些平滑过渡的视觉与色彩效果。

    发明内容

    [0007] 本发明的目的在于克服现有技术中的问题,提供一种基于Gabor特征空间的视频 染色方法。

    [0008] 本发明的基于Gabor特征空间的视频染色方法,其步骤包括:

    [0009] 1)利用视频的纹理特征构建旋转不变的Gabor滤波器和Gabor特征空间;

    [0010] 2)基于能量最小化生成视频的Gabor流并选择关键帧;

    [0011] 3)对关键帧进行染色;

    [0012] 4)基于Gabor流的计算结果将关键帧的颜色在视频帧间传播;

    [0013] 5)用户通过交互方式对存在高误差的染色区域进行修补。

    [0014] 步骤1)所述的Gabor滤波器由4个尺度、6个方向的滤波器组构成,其方向的调整 根据像素所在局部区域的纹理方向判定算子得到,并可进行降维来压缩处理。

    [0015] 步骤1)所述的Gabor特征空间主要用于对像素的纹理特征相似性进行度量计算。

    [0016] 步骤2)所述的选择关键帧的方法为:基于视频的Gabor流计算帧间颜色传播误 差,将误差累积值超过预设阈值的帧选取为所述关键帧;所述帧间颜色传播采用多分辨率 金字塔的方法计算,并通过图形硬件GPU进行加速计算。

    [0017] 步骤3)所述的对关键帧进行染色的方法为:通过用户交互操作得到所述关键帧 中部分像素的颜色,然后利用能量最优化原理将这些颜色在关键帧的Gabor特征空间中传 播;所述对关键帧进行染色的方法可用于普通图像的染色。

    [0018] 步骤4)所述的帧间传播通过相邻帧间的像素与像素的并行颜色传播实现,并可 以用图形硬件GPU加速。

    [0019] 所述GPU采用CUDA并行处理架构,具备可编程功能。

    [0020] 步骤5)中用户修补后的颜色可在局部图像空间进行再传播,以实时得到修正后 的染色效果。

    [0021] 与现有技术相比,本发明的有益效果如下:

    [0022] 1、本发明构造了具有旋转不变性的视频/图像特征空间,用以度量视频/图像中 像素所在区域的纹理相似性,由此可对色彩在Gabor特征空间中的传播和优化进行有效处 理。

    [0023] 2、本发明的染色方法简单易用,且支持用户交互,可通过多遍叠加优化的计算,实 现视频颜色的修补与渐进染色的优化处理,并得到实时显示。

    [0024] 3、在视频染色中,整个颜色的修补过程可以完全在图形硬件GPU平台上完成,相 比于其它染色方法,运行速度能得到极大提高。

    附图说明null实施方式

    [0035] 以下通过实施例并结合附图对本发明进行详细的描述,但不构成对本发明的限 制。

    [0036] 视频染色的实质任务就是将颜色从用户指定的少量像素向其余颜色未知的灰度 像素进行传播,并传播到未知灰度的视频图像上。而染色的根本任务是由用户指定少数像 素的颜色,然后将颜色分配到(颜色不详)图像/视频的像素中。为此,本发明基于以下的 观察结果提出了本发明,即:视频中纹理特征或者灰度值相似的像素(纹理,灰度值)一般 有类似的可移植颜色。在此,关键问题是如何量化地度量纹理特征的相似性关系,并获得灰 度视频中的像素相似性。

    [0037] 对此,本发明构建了基于Gabor滤波特征值的像素特征空间,就可以根据像素的 相似性对颜色进行有效的颜色传播。对于像素颜色在不同帧中的匹配关系,一种简单的解 决方案是计算视频的光流,然后根据光流沿视频的时间轴对颜色进行传播。然而这种方法 中,光流计算的误差常会导致用户输入的颜色在染色中发生混淆。同时,该方法需要通过求 解一个大型的线性系统,计算开销很大。为此,本发明建立一种Gabor流,以专门测量颜色 在视频序列中的传播误差,可避免对视频数据进行整体优化所带来的大量计算。经试验表 明Gabor流可以很好地表达视频中大量像素的运动关系,因此可有效处理色彩传播的帧间 误差问题,得到高质量的视频染色效果,如图1所示的河流视频中利用Gabor流技术得到的 染色效果,其中(a)为原始视频中的一幅图像,用户对该图像的一些像素赋予了颜色,(b) 为根据用户赋予的颜色对该原始图像染色后的效果图,(c)为是根据Gabor流颜色在视频 帧间传播后的效果图。

    [0038] 本发明的视频染色方法可参见图2,其步骤包括

    [0039] a)从原始视频中提取局部纹理特征;

    [0040] b)构建旋转不变的Gabor特征空间:利用视频的局部纹理特征调整Gabor滤波器 方向,构造具备旋转不变特性的Gabor滤波器,并生成视频Gabor特征空间,用于染色中的 像素颜色传播与匹配;

    [0041] c)计算Gabor流:基于能量最小化生成关于视频的Gabor流;

    [0042] d)选择关键帧:利用视频的Gabor流计算帧间颜色传播的误差,误差累积值超过 了预设阈值的帧,选取为视频染色的关键帧;

    [0043] e)关键帧染色:通过用户交互操作得到关键帧中部分像素的颜色,然后利用能量 最优化原理将这些颜色在关键帧的Gabor特征空间中传播,直至达到平衡状态;能量最优 化原理即能量最小化计算,在求解能量最小化的过程中,其相应的方程组求得稳定解时即 达到平衡状态。

    [0044] f)将颜色进行帧间传播:按照Gabor流的计算结果,将关键帧的颜色在视频帧间 传播;

    [0045] g)染色的交互修补:对于染色效果存在高误差的地方,用户可以通过交互操作对 颜色进行修改,并在局部图像空间进行修改颜色的再传播,以实时得到修正后的染色效果。

    [0046] 下面对上述视频染色方法做具体的说明。

    [0047] 1•旋转不变Gabor特征空间及Gabor流计算:

    [0048]本发明的目标是建立一个函数空间,以便有效衡量像素间的纹理相似性。 [B.S.Manjunath and W. _Y. Ma,"Texture features for browsing and retrieval of image data,''IEEE Trans. Pattern Anal. Mach. Intell.,vol. 18,no. 8,pp. 837-842,1996.] 提出了用Gabor小波来分析纹理的特征。首先,2维的Gabor小波及其傅里叶空间中的数学 (1) (2) 表达式为:

    [0051] 其中

    过对函数g(x,y)进行适当的尺度放缩和方向旋转, 就能得到各个尺度和方向下的Gabor小波(公式(3)):

    [0052] gmn(x, y) = a_mg(x,,y'),a>l (3)

    [0053] x' =a_m(xcos0+ysin9 ),yr =a_m(-xsin0+ycos0 )

    [0054] 其中m代表尺度,n代表方向。0 = nil/K,K是总方向数。

    [0055] Gabor小波基不具备正交性,这意味着用它过滤图片将产生冗余信息。为此 Manjunath提出了一种参数估计的方法来最大限度地避免滤波的冗余信息:令仏和U h分别 代表中心频率的下界和上界,K代表总方向数,K为总尺度数,可用如下经验公式来估计参 数〇 v和〇 u

    [0059]对于输入图像I(x,y),它的Gabor小波变换可以表示成如下卷积形式:

    [0060]

    (5) Q

    [0061] gm, n是公式⑶定义的Gabor小波函数,上标*代表求复共轭,下标m和n标志了 尺度和方向。然后,对得到的结果图中的每个点计算某个邻域内的均值和方差:

    [0065]利用[B. S. Manjunath and W.-Y. Ma,"Texture features for browsing and retrieval of image data," IEEE Trans. Pattern Anal. Mach. Intell. , vol.18, no. 8, pp. 837-842,1996.]中的方法,并结合本发明的视频染色技术,当U1= 0• 04, U h= 0• 5, S = 4,K = 6 (S为滤波器组的尺度数,K为滤波器组的方向数),窗口大小取5X5时对图像中纹 理特征检测的效果最佳,从而可以为颜色和图像中的纹理特征建立较准确的对应关系。把 所有尺度和方向下的均值和方差进行聚集,可得到特征向量F:

    [0066] F-(y〇〇,v〇〇,u01...y35jv35) (7)

    [0067] 图像中任意两点间的纹理相似性可用它们特征向量之间的某种距离来度量,一般 来说,选用欧氏距离就能达到不错的染色目标(虽然它并非是关于人眼分辨特性的最佳表 达)。但这样会有一个问题:如果两个像素在纹理特征上相同,只是在纹理的旋转方向上 有不同,则该度量方法会将它们当成是不同的两个像素。这样的误判现象在表现自然景观 的视频数据中非常常见。为此,本发明需要构建一种具有旋转不变特性的Gabor滤波器。 Gabor滤波器主要由4个尺度、6个方向的滤波器组来构成,其方向的调整根据像素所在局 部区域的纹理方向判定算子得到,并可进行降维来压缩处理。通过降维来压缩处理是指针 对Gabor特征向量采用主成分分析进行降维,比如可以将48维的Gabor特征向量降维到16 维向量,主成分分析是标准算法。对此,本发明先确定一个能计算纹理方向的函数A (x,y), 使得在像素位置(x,y)通过局部的方向判断可以得到该像素处的纹理方向,即A(x,y)= 0 (该公式表示在图像空间中(x,y)坐标上的像素点,它的局部纹理方向为0,0在0-180 度之间);然后通过设置公式(3)中Gabor滤波器的0值,使0 = 0,以获得与旋转方向 一致的Gabor滤波器,并构造出旋转不变的Gabor特征空间。图3比较了具有旋转不变性 的Gabor滤波器与传统的二维Gabor滤波器的区别。本发明在图中衣物上指定的3样本像 素点,它们都有相同的纹理,但纹理方向不同;在图3右边,显示了这两种滤波方式对这3个 像素点的滤波效果,这里均采用了 48项滤波均值和方差进行量化统计。从统计曲线看,使 用旋转不变Gabor滤波器的三条曲线基本相似,表示了这3个点具有很好的相似性,而使用 传统的Gabor滤波器则没有这种相似性。因此,旋转不变性的Gabor滤波器具有更好的纹 理特征鉴别能力。

    [0068] 基于旋转不变Gabor滤波器,本发明可建立一个特征空间,然后基于这些Gabor滤 波的特征值,按照光流计算的方法[T. Brox,A. Bruhn,N. Papenberg,and J. Weickert,"High Accuracy Optical Flow Estimation Based on a Theory for Warping," LECTURE NOTES IN COMPUTER SCIENCE,pp. 25-36, 2004.]进行计算,就得到了 Gabor 流的流场。利用 Gabor 流,本发明就可跟踪计算像素沿着时间轴的相似性。图4中显示了帆船视频中对像素颜色 传播情况进行测量的Gabor流。本发明利用Gabor流计算像素运动误差,并用该误差的大 小来衡量选取关键帧,即:如果一个帧的精度误差累积值超过了预设的阈值,该帧就被设为 一个关键帧,阈值的设置由用户根据不同的视频的情况来取值,在此实施例中取为〇. 1。图 5显示了登山视频中选择关键帧的例子。图6、7和8分别对不同的视频进行了 Gabor流方 法与光流方法的计算,并比较了各自的颜色传播误差。本发明发现利用光流(左侧图)所 产生的颜色传播高误差区域明显大于Gabor流的(右侧图)。这说明Gabor流能更好地控 制颜色传播误差。在本发明的方法中,基于旋转不变性的Gabor特征被用来进行帧间像素 的运动匹配,可以大大提高纹理发生旋转时的匹配精度,对于场景发生旋转的视频数据中 的颜色帧间传播准确性更高。同时由于视频图像的像素匹配往往具有相互的独立性,便于 本发明采用离散化的并行匹配算法,以较快地生成视频中所有像素的帧间匹配关系。假设 像素的Gabor特征值有p个元素组成,表示为F k,k = 1--p,那么其对应的Gabor流能量 为

    [0069]

    (8)

    [0070] 通过求解能量最小化的线性方程组,可以得到基于Gabor流的像素颜色匹配。

    [0071] 2•关键帧染色:

    [0072] 视频染色中最困难的任务在于用户通常需要输入很多彩色笔画,而完成这些笔画 的输入通常非常费时而且需要较多的专业技巧。针对这个问题,本发明的方法是首先自动 选取视频中的关键帧,并对这些关键帧进行染色,然后再将颜色传播到视频序列的其他帧 上。颜色的帧间传播是通过计算得到的Gabor流来完成的,采用的是多分辨率金字塔的计 算方法,对于其传播的精度,本发明采用[Y. Chuang,A. Agarwala,B. Curless,D. Salesin, and R. Szeliski. Video matting of complex scenes.Proceedings of the 29th annual conference on Computer graphics and interactive techniques. ACM Press New York, NY,USA,2002, pp. 243-248.]的方法来测量。由于颜色在帧间传播具有双向性,所以本发 明对于Gabor流也进行了两个方向上的精度测试,并得到相应的误差度量图,再由此创建 Gabor流的精度累积误差图。事实上,本发明对于关键帧的选择正是采用了对累积误差进 行度量的方法,如果累计误差超过预设的阈值,则判定为关键帧。选择好关键帧后,本发明 针对关键帧的染色,主要是基于输入笔画与纹理的相似性进行的。为此,本实施例提出一种 基于能量最小化的染色方法,使得像素间的颜色传播在Gabor特征空间中进行,而不是在 一般方法所采用的八-连通的图像空间。对于像素i,本发明在Gabor特征空间中寻找其 最近的邻居像素点j作为i在纹理特征空间中的邻居(这里像素i和像素j并不一定在实 际图像坐标上具有相邻的位置关系)。由此,本发明可以建立所有像素在Gabor特征空间 中的邻接关系。本发明的方法中,视频图像被转换到YUV颜色空间。因此,在灰度值已知的 条件下,本发明需要求解视频图像的U和V颜色分量。为叙述方便,本发明在下面仅针对U 分量的求解过程进行详细介绍,而V颜色分量的求解方法也是相同的,不再赘述。在染色过 程中,本发明的目标实际上是对视频特征空间中的相邻像素的颜色差异按加权方式求最小 化,即

    [0073] (9) i k^NF (z)

    [0074] 这里^是范围在[0,1]中的权值,且

    表示像素k属于像素 i在Gabor特征空间中的邻居,并且像素k与像素i在纹理特征空间中越接近,则相关权值 越大。U表示U分量,E(U)取最小值,可以进行大规模线形方程组求解,得到全部像素的U 分量,同理可求出V分量。

    [0075] 具体来说,本发明求解权值的数值与特征空间中的像素距离相关,即

    [0076]

    [0077] 这里〇 F(i)是像素i与其所有在特征空间中相邻像素的距离的方差。

    [0078] 无论纹理区域在图像中是否坐标相邻,本发明的关键帧染色优化方法都可以有效 地将颜色传播到图像中的这些纹理相似的区域。因此,与其它在图像空间传播颜色的染色 方法相比,本发明的方法不受限于图象空间的连通性,可以对图象空间中不连通的相似像 素进行色彩传播。由此,本发明的方法可很好地减少笔画输入量,且得到很好的染色效果。

    [0079] 3•基于Gabor流的颜色传播:

    [0080]当关键帧染色完毕后,本发明将关键帧上的颜色传播到的其他的中间帧中。在整 个颜色的传播过程中,染色效果可能存在着传播误差,这种误差随着传播帧数的增多而逐 渐累积增长。为了解决染色的误差问题,本发明先对Gabor流的传播精度进行测量,然后 在低误差的图像区域本发明直接将关键帧的颜色值沿着Gabor流传递到相应像素,而对于 高误差的图像区域的像素,则允许用户通过交互的方式来实时修正并优化视频帧中的像素 色彩细节,高误差一般是指当像素的相应的Gabor流误差大于一定阈值的像素区域,而该 像素区域的选择则是根据具体的视频来判断的,在本实施例中的高误差被认为是误差大于 0.0002的像素区域。为此,本发明提出了一种迭代方式的能量优化方法,将该用户指定区域 的指定颜色传播到它在Gabor特征空间中的邻居:

    [0081]

    [0082] 基于Gabor流,本发明的染色方法能够很好地处理视频图像中的大多数帧图像。 但这种方法仍有可能对纹理特征判断不准,特别是当颜色传播到不同纹理的边界处的时 候,容易导致染色效果出现误差。为此,本发明允许用户在误差大的帧图像上交互地加入修 补的颜色笔画以改善质量,并在修补颜色的传播上进行一定的图象空间的限制。在此,不同 于其它方法中基于块识别来进行颜色匹配,本发明对于染色的改进和修补是在Gabor特征 空间进行的,能较好地适应不同场景的纹理旋转和尺度变化。经过测试,这种在图像空间对 于颜色效果进行修补的方法可以取得很好的染色效果,并且能有效保持纹理颜色在空间关 系上的连续性。

    [0083] 本实施例的微机配置为Intel Core Duo 2. 3G CPU,3G内存,GeForce 8800显卡以 及Window XP操作系统。本发明为视频颜色在时间序列上保持连贯性提出了有效的计算方 法,并建立了基于Gabor小波的像素特征空间。其中对于Gabor流的设计主要利用了视频 图像序列中像素颜色的时间连续性,而这种时间连续性可以通过针对视频图像的纹理分析 加以描述。为更好地检测视频图像像素的纹理特征,本发明设计了一种旋转不变Gabor滤 波器组进行滤波,从而构建了具有旋转不变性的Gabor特征空间。利用这种新的Gabor特 征空间,本发明可以基于纹理相似性和用户输入来优化计算像素的色彩,最小化颜色的误 差。由于颜色传播是在纹理特征空间中进行的,只要像素具有类似的纹理特征,本发明的方 法就可以有效地将颜色进行传播,所以本发明的染色方法可以较好地处理图像中的不连通 但纹理相似的区域,而这是其它染色算法往往难以处理问题。

    [0084] 本发明测试的样本视频,其分辨率范围介于300X400与800X600之间。根据本 发明的测试,对于长度为300帧的视频图像序列,通常本发明只需要选择三到五个关键帧, 就能对整个视频进行高质量的染色。对于染色效果的修补,也可以通过GPU加速,实时地将 颜色传播到目标像素区域。每次颜色修补,一般进行大约1000次并行迭代的颜色扩散就能 得到很好的结果。由于这些迭代计算可基于nVidia的CUDA进行程序实现,因此颜色修补 具有很高的运行效率。表1列出了本发明的实验运行时间统计数据。图6、7和8中分别采 用光流和Gabor流对视频数据进行染色效果的对比,由实验结果可知,Gabor流在处理视频 染色过程中较光流更为准确有效(右列的图象是使用的Gabor流,而左列的是使用光流)。 在本发明的方法中,通过建立基于Gabor滤波的Gabor特征空间,对视频在时空两个维度上 进行分析,有助于对色彩效果进行基于纹理相似性的优化和传播,并可采用并行处理的方 式,很好地提高工作效率。同时,本发明能有效处理视频场景中纹理旋转或者在空间位置上 不相连的纹理区域,而其它视频染色方法往往仅依靠空间连通性进行像素间的颜色传播, 难以处理这些情况。

    [0085] 按照上述过程,本实例中选用七个小视频进行了染色实验。表1中对这些视频的 数据量和运行时间进行了统计。

    [0086] 表1本发明方法在GPU平台上运行的效率统计

    [0087]

    [0088] 表1说明了新的视频染色算法可以通过GPU的并行处理,使得染色的修补能实时 地进行和显示。图9和10显示了视频的染色效果,所选取的处理对象分别为攀岩视频和滑 雪视频,图9(a)和图10(a)为原始视频中的一帧,图9(b)和图10(b)是对该帧图像进行染 色后的效果,图9 (c)和图10 (c)是颜色在帧间传播染色后的效果。实验效果表明新的染色 方法可以针对各种不同场景视频取到较好的效果。

    [0089]在本发明中,本发明的视频染色方法采用一种优化的Gabor流来计算和度量纹理 特征在视频数据中的相似性,并进行颜色的传播。首先,本发明改进Gabor滤波器的构成形 式,使其具有旋转不变性,由此可提高纹理特征相似性度量的效率。其次,本发明在Gabor 特征空间对颜色进行的优化传播,可有效处理图象空间中不连通而特征相似的象素染色。 对于视频染色中的帧间颜色传播,本发明建立了 Gabor流计算的方式,能比已有的光流方 法更好地控制误差累积,使得色彩传播在时间序列上能得到优化的实施。同时,本发明可以 有效利用GPU进行并行化的实现,得到很高的运算效率。实验表明,本发明适用于具有区域 性纹理的各类视频数据,特别是包含自然场景内容和视角旋转的黑白视频。本发明可以直 接推广应用到相关的数字媒体设计与电影制作过程中,具有较强的实用意义。

    展开

专利技术附图

< >

服务流程

过户资料

  • 买卖双方需提供资料
  • 平台提供
  • 过户后您将获得
  • 买家
  • 卖家
  • 公司
  • 企业营业执照
  • 企业营业执照

    专利注册证原件

  • 个人
  • 身份证

    个体户营业执照

  • 身份证

    专利注册证原件

  • 专利代理委托书

    转让申请书

    转让协议

  • 手续合格通知书

    专利证书

    专利利登记簿副本

安全保障

  • 品类齐全

    海量资源库,平台整合几十万闲置资源。
  • 交易保障

    完善的资金保障体系确保买卖双方资金安全。
  • 专人跟进

    专业交易顾问全程服跟进,确保交易流畅。
  • 快速响应

    专业在线/电话客服服务,快速响应贴心服务。
  • 售后无忧

    资质过硬,国内大知识产权服务平台。

在线客服

在线咨询

010-83278899

返回顶部