1. 概述
在电视节目制作和播出的过程中,电视信号格式的转换是不可避免的环节。无论在信号交换中心(总控中心)或播出系统,还是演播室和电视转播车以及后期制作等视音频系统,总会遇到需要转换和处理各种信号的问题。电视信号格式之间的转换有许多种情形:模拟与数字、复合与分量、标清与高清以及综上所述的复合型高标清上下变换。现如今,国家大力推进高清电视技术的发展。高清电视具有临场感、有较高的清晰度,要求每幅画面的扫描线数大约是目前标准清晰度电视扫描线数的两倍,画面更加清晰逼真;还具有较高的伴音质量,通常是立体声或5.1路环绕声,声音效果更具震撼力。
目前大多数电视台的节目制作、播出和存储系统都是以标清信号系统构建的技术平台,从前期采录到后期的编辑、制作、播出、存储等处理环节多为标清系统,高清转播车和高清演播室,主要用于体育节目、综艺节目的录制和专题片拍摄,一是为日后开办高清频道作节目储备;二是当作“高清岛”来使用,其高清信号需要下变换为标清,满足目前标清信号系统的使用需要。
以广东卫视频道为例:2008年广东卫视播出节目全天播出24小时,购买类节目约11.8小时(电影0.83小时、电视剧10.13小时、动画片0.83小时),转播类节目(新闻联播、体育比赛等)约0.42小时,自办节目(卫视新闻、社会纵横等)约8小时,重播节目约1.74小时,其余为广告和宣传片时间。
在高清系统设备储备方面:目前,拥有一辆高清转播车、两个高清演播室(400平米和新闻)、十几套高清摄录设备、电视剧高清非编一套。在高清节目储备方面:按不完全统计,目前广东电视台高清节目的储备量约为495小时,其中体育节目435小时、综艺节目13小时、电视剧46.5小时;自制节目总时长约为95小时。这种程度的积累,在兼顾原有标清节目播出的基础上开办高清频道,难度是非常大的。因此,我们需要高质量的转换技术提供最具成本效益的解决方案,以实现平稳,面向未来的高清转换。
2. 高标清上下变换
2.1 高标清格式标准概述
中华人民共和国国家标准GB/T 14857-1993《演播室数字电视编码参数规范》和中华人民共和国广播电影电视标准GY/T 155-2000《高清晰度电视节目制作及交换用视频参数值》分别规定了我国广播电视行业所使用的数字标准清晰度和高清晰度电视节目制作、交换所涉及的基本视频参数值。
2.1.1 数字视频信号
对于数字电视信号,很多人应该不陌生了。以摄像机作为信号源来说,数字电视信号需要由模拟信号按照某种标准去抽样、量化和各种数字处理,还可以在数字消隐期间插入辅助数据,嵌入声音等等。高标清电视系统有什么异同?表1是我国标清数字系统和高清数字系统的一些主要参数上的比较。
表1. 我国标清数字系统和高清数字系统参数比较
对于标清,国家标准所规定的模拟信号标称带宽是6MHz,Y或R、G、B信号每行取样点数为864个,取样频率为864×25×625=13.5MHz,CB、CR信号每行取样点数为432个,同理取样频率为6.75MHz。编码格式我们优选10比特线性量化,那么标清串行数据传输速率为13.5×10+2×6.75×10=270Mb/s。对于高清,模拟信号标称带宽是30MHz,Y或R、G、B信号每行取样点数为2640个(1125/24/1:1逐行扫描格式中取样点数为2750),取样频率为2640×25×1125=74.25MHz(1125/24/1:1逐行扫描格式中取样频率为2750×24×1125=74.25MHz),CB、CR信号每行取样点数为1320个(1125/24/1:1逐行扫描格式中取样点数为1375个),同理取样频率为37.125MHz。对于10比特线性量化,那么HD的串行数据传输速率为74.25×20=1.485Gb/s。
另外,我国广电总局制定的行业标准GY/T161-2000《数字电视附属数据空间内数字音频和辅助数据的传输规范》(等效采用了ITU-R BT.1305号建议书)规定了数字音频数据如何嵌入数字视频SDI流的行逆程中的辅助数据空间中的。
2.1.2 数字电视的图像质量
16:9的宽高比和高图像分辨率是高清电视系统的最基本特征。我国高清电视图像的水平和垂直亮度清晰度大约是现在所用的PAL制式的2倍。所以,高清电视图像中亮度图像像素的总数约是后者的4倍。高清电视中增加的细节是通过使用了一个大约5倍于标清电视系统的视频带宽获得的。
高清电视适合在大约3倍图像高度的距离观看可以获得更多要分辨场景的全部细节给人以更强的临场感。CCIR(国际无线电咨询委员会)的801报告中对高清电视这样要求:“高清晰度电视系统设计要求是使观看者在图像高度大约3倍距离处能看到或接近看得清楚细节的程度,达到视力正常的观看者在看原始景物中相同的感觉。而传统的标清电视适合在图像高度大约6-7倍距离处观看,它给人带来的震撼与临场感是远不及高清电视的。
2.2 高标清上下变换的基本原理
如何在高、标清节目之间转换时解决宽高比、图像压缩不变形、降低噪声、消除锯齿等问题来保证信号质量是大家共同面对的问题。格式变换器器就是将不同格式的信号互相转换。通常将标清到高清信号的变换模块称为上变换器(Up Converter);反之,高清到标清信号的变换模块则被称为下变换器(Down Converter)。有些下变换器还内含有数字到模拟(D/A)转换,便于对输出信号进行监视。有些则专门设计为监视用下变换,因此也称监视级下变换器。当进行格式下变换时,图像高频分量丢失;当进行上变换时,图像被内插再取样。
图1 高标清SDI信号上/下变换的信号处理流程框图
如图1所示,高标清上下变换的一般流程为去隔行、空间转换、图像增强、色度转换、输出格式化。这些流程需要使用去隔行技术、运动补偿技术、宽高比转换技术等算法来处理图像。
2.2.1 去隔行
由于受硬件处理速度以及传输带宽的限制,现行的广播电视系统都是使用隔行扫描制式的。要处理高清与标清之间的高标清上下变换,最直接要考虑的问题就是图像分辨率的变化。那么,要处理图像的缩放,首先就要把隔行的两场画面结合成一个完整的画面。在这里,就需要运用去隔行技术。
图2 一帧中两场画面有相当的不同
去隔行的方法可以分为四类:单一场去隔行(intra-field deinterlacing)、场间去隔行(inter-field deinterlacing)、动态自适应去隔行(motion adaptive deinterlacing)和运动补偿去隔行(motion compensated deinterlacing)。
单一场去隔行是非常容易且非常节省资源的一种去隔行方法,通常只需要一行像素的缓冲内存以及简单的内插。例如“line doubling”,这是一种最常见的单一场去隔行方法,简单来说就是将一个场放大成为一个帧的大小再播出,若是影像来源是每秒50场的隔行式影像,使用这个去隔行方法将可以得到每秒50帧的影像。使用这个去隔行方法的好处为非常简单且非常快速,硬件的成本将会非常低,但是缺点是画质会看起来比较松散,不锐利;且若是影像中含有横向的细线,在某些场可能会刚好没有被扫描到,因此重建出来的影像细线的部份看起来会有闪烁的感觉。
场间去隔行就是将连续的两个场结合为一个帧的方法。例如图3所示的“weave(交织法)”,它是将连续的两个场直接结合成为一个帧,不做任何修改。由于在垂直方向保留了全部的分辨率(不像line doubling只有一半的分辨率),因此使用“weave”去隔行得到的画质比使用“line doubling“好,但是只有在画面静止不动的地方,在画面有移动的地方会有明显的横向条纹以及锯齿。场间去隔行方法需要一个场大小的缓冲内存,比起单一场去隔行方法所需要的略多,但硬件还是相当的简单及便宜。
图3 “weave”去隔行方法
动态自适应去隔行方法是侦测影像中何处是动态的,以及何处是静态的;在画面中静态的部份使用场间去隔行以得到垂直方向完整的分辨率,而在动态的部份使用单一场去隔行以避免锯齿的现象。使用这个方法侦测动态的算法是相当重要的,不好的算法也会导致一些侦测错误使得画面中出现一些恼人的线条。使用动态适应性去隔行方法需要比较快速的硬件去计算动态侦测算法,另外也需要一或多个场的缓冲内存,算法使用越多的场来侦测动态将会越准确,相对的需要更好更昂贵的硬件。
运动补偿去隔行方法根据邻近的场使用动态估计(motion estimation)去预测邻近的场之间画面中物体的移动,借由动态估计可以得到的画面中每一个宏块(macroblock)的动态向量(motion vector),然后使用前一个场以及动态向量可以重建出一个新的场,在将此两个场合并完成去隔行。使用这个去隔行方法将会得到非常好的影像品质,因为这个去隔行方法作了非常复杂且精准的预测;动态估计需要非常大量的计算,且也需要非常大的缓冲内存去暂存每个方块估计的结果,这使得使用这种方法的去隔行装置非常昂贵且速度较慢。
很显然,单一场区隔行和场间去隔行方法缺点很大,都不适用于电视制播系统中的高标清上下变换器。厂商会根据产品的定位,从动态自适应去隔行与运动补偿去隔行方法中去选择。
2.2.2 图像缩放与增强
我国使用的标清电视分辨率为720×576,推荐使用的高清电视分辨率为1920×1080,两者间互相转换时需要对图像按一定要求进行缩放处理。
单幅图像缩放有多种算法,比较常用的有最邻近插值法(nearest neighbor)、双线性插值法(bilinear interpolation)、双三次插值法(bicubic interpolation)等。最邻近插值法(临近取样法)是一种最基本、最简单的图像缩放算法,其运算速度最快快,耗用资源少,但效果是不怎么好的,放大后的图像有很严重的马赛克,缩小后的图像容易有严重的失真;效果不好的根源就是其简单的最临近插值方法引入了严重的图像失真。
图4 双线性插值法示意图
双线性插值法,又称双线性内插法。如图4所示为较简单的双线性插值法示意图。
在双线性插值中,新创造的像素值,是由原图像位置在它附近的(2×2)4个邻近像素的值通过加权平均计算得出的。这种平均算法具有放锯齿效果,创造出来的图像拥有平滑的边缘,锯齿难以察觉。这种算法对2×2像素块进行,先在水平方向做两次线性插值,再在垂直方向做1次线性插值,得插值点F,即
Fh1=L0fi,j+L1fi,j+1
Fh2=L0fi,j+1+L1fi+1,j+1
L0=1-?x; L1=?x
F=N0Fh1+N1Fh2
N0=1-?y; N1=?y
双线性插值法输出系数可按线性、阶跃、正弦或余弦等函数取值,如图5所示。途中横坐标与插值点位置对应,纵坐标为相应的输出系数,两者的归一化值均为0~1。为提高缩放速度,通常将其固化为插值表。
图5 双线性插值法输出系数
对双线性插值法,若?x=?y=0.5,则因黑白像素相同的水平和垂直图像细节变成单一灰色而丧失相应的图像细节。双线性插值法具有一定的低通滤波性,也就是说一般情况下会降低图像的清晰度并产生由变换差拍造成的伪像。
图6是最邻近插值和双线性插值缩放图片的效果对比:
(a)原始图片
(b)最邻近插值放大图片
(c)双线性插值放大图片
图6 最邻近插值和双线性插值法在放大图像时的对比
若用双三次插值等较复杂的算法,参与插值计算的输入信号像素数增多,它输出图像的每个像素都是原图16个像素运算的结果,能创造出比双线性插值更平滑的图像边缘。其基本数学关系式如下:
经过双三次插值运算缩放后的图像虽也会某种程度地损失细节,并出现伪像,但图像主观效果可能较好。双三次插值法根据用户的需求特点还可细扩展为双三次插值平滑化和双三次插值锐化的插值法。
以现在的硬件水平,无论采用双线性插值法还是双三次插值法处理高、标清电视图像的转换,加上帧存器储存图像的时间,完全可以实现高、标清高标清上下变换只有一帧时间的延时。
最邻近插值法、双线性插值法和双三次插值法其实都属于不基于边缘的图像缩放算法(non-edge based image scaling)。此外,还有基于边缘的图像算法(edge-based scaling methods),这类算法可以得到比不基于边缘的图像缩放算法更好的视觉效果,但它们算法更加复杂,运算的时间较长。这种图像处理方法最重要的就是边缘检测,它是一个非常复杂的问题。
边缘检测的目的是标识数字图像中亮度变化明显的点。图像属性中的显著变化通常反映了属性的重要事件和变化。这些包括(i)深度上的不连续、(ii)表面方向不连续、(iii)物质属性变化(iv)场景照明变化。 边缘检测是图像处理和计算机视觉中,尤其是特征提取中的一个研究领域。边缘检测的方法有多种,它们的绝大部分可以划分为两类:基于查找一类和基于零穿越的一类。基于查找的方法通过寻找图像一阶导数中的最大和最小值来检测边界,通常是将边界定位在梯度最大的方向。基于零穿越的方法通过寻找图像二阶导数零穿越来寻找边界,通常是Laplacian(拉普拉斯算子)过零点或者非线性差分表示的过零点。
如果将边缘认为是一定数量点亮度发生变化的地方,那么边缘检测大体上就是计算这个亮度变化的导数。为简化起见,可以先在一维空间分析边缘检测。例如一行不同点亮度的数据:在图7的1维数据中可以直观地说在第4与第5个点之间有一个边界。
图7 一维空间的边缘检测
除非场景中的物体非常简单并且照明条件得到了很好的控制,否则确定一个用来判断两个相邻点之间有多大的亮度变化才算是有边界的阈值,并不是一件容易的事。
计算出导数之后,下一步要做的就是给出一个阈值来确定哪里是边缘位置。阈值越低,能够检测出的边线越多,结果也就越容易受到图片噪声的影响,并且越容易从图像中挑出不相关的特性。与此相反,一个高的阈值将会遗失细的或者短的线段。
最后,被判定为边缘的图像结合类似前面所述的图像缩放算法进行复合运算,得到最终高质量的图像缩放。
判定插值结果的好坏。第一个标准:走样现象的轻重。放大图像的时候,要看边缘是否产生了锯齿,缩小图像的时候,看看是否有干扰条纹,边缘是否平顺。第二个标准:边缘是否清晰?第三个标准:过渡带的层次感细节感怎么样?
2.2.3 宽高比变化
标清电视系统的宽高比为4:3,高清电视系统的宽高比为16:9。高标清电视信号转换必然带来宽高比的考虑。高清电视下变换至标清电视主要有“信箱(Letter Box.)”、“切边(Side Cut)”、“挤压(Squeeze)”和“14:9”四种方式,
如下图8所示。
图8 下变换模式示意图
相对应的,在标清上变换至高清也有四种主要方式:“上下切(T&B Cut)”、“镶边(Side Bar/ Pillarbox)”、“拉伸(Stretch)”和“14:9”。如下图9所示
图9 上变换模式示意图
在高清下变换至标清时,“信箱”和“切边”模式保留了正常的画面构图。“信箱”模式保留了原有高清画面构图和内容的完整性,但最大地损失了图像的细节;“切边”模式在切掉高清画面左右共四分之一的内容后,较多地保留了原图像的主要内容。而“挤压”模式使得图像内容比例变形,不符合观众的欣赏习惯,所以一般不使用这种模式。
在标清上变换至高清时,“镶边”和“上下切”模式保留了正常的画面构图。“镶边”模式保留了原有标清画面构图和内容的完整性,但观众会对加在电视画面的两条黑边有些反感;“上下切”模式在切掉原标清画面上下共四分之一的内容后,保留了原图像的主要内容,但此种变换模式很可能丢掉原图像的重要内容,并且计算出来的图像内容太多,画面质量较差。而“拉伸”模式使得图像内容比例变形,不符合观众的欣赏习惯,所以一般不使用这种模式。
在电视生产端没有14:9宽高比模式, 14:9模式是上下变换处理的折中方案。无论是4:3还是16:9的图像,使用该模式都需要裁剪掉小部分画面(4:3→14:9要裁掉1/7画面,16:9→14:9需要裁掉1/8画面),减少格式变换带来图像内容的丢失。现实是,4:3→14:9的上变换模式不符合高清观众欣赏习惯也不实用,仅在全16:9画幅的图像采用“14:9”下变换时,可以获得标清观众特别是使用CRT电视的观众的好评。
图10 14:9的对应关系
由于接收机的缘故,在实际运用中高清下变换适合使用“切边”、“信箱”和“14:9”模式,标清上变换只适合使用“镶边”模式。
2.3 高标清上下变换需要注意问题
2.3.1 色域
1953年由美国开发的NTSC制式带来了彩色电视,NTSC制式规定了以C白光源为基准白的NTSC色域。然而,NTSC色域过于理想化,彩色显像管无法实现。在此基础上,欧洲和美国分别在实用化的基础上制定了以D65白为基准白的EBU和SMPTE C标准,这两个色域覆盖的色彩空间范围都比NTSC色域小。
ITU-R BT.709建议书规定的高清电视色域是参考了EBU和SMPTE C色域标准而制定的,其色域范围是两者的折中。ITU-R与EBU的色域几乎是相同的,只是绿色坐标的x值略有差异。如图11和表2。
表2. 各标准所规定的RGB和基准白
图11 电视色域比较
彩色图像记录的格式,常见的有 RGB、YUV、CMYK等。彩色电视最早的构想是使用RGB三原色来同时传输。这种设计方式是原来黑白带宽的3倍,在当时并不是很好的设计。RGB 诉求于人眼对色彩的感应,YUV则着重于视觉对于亮度的敏感程度。YUV的发明解决了彩色电视机与黑白电视机的兼容,同时大大节省了传输带宽。
电视的拍摄和最终显示都是在RGB域实现的,亮度矩阵式RGB与YUV这两个域之间相互转换运算的基准。根据表2所列的各制式标准的基准白和RGB色坐标数值可以计算出各标准亮度矩阵方程。在标清时代,由于彩色电视发展前期一直采用NTSC制的亮度方程,它与其它制式的亮度方程互换时仅造成黑白图像灰度层次出现人眼不易觉察的失真,对彩色图像的重现质量基本无影响。所以,标清电视不同标准其色域的亮度方程都采用了基于C白光源和NTSC色域制定的亮度矩阵:
Y=0.299R+0.587G+0.114B
B-Y=-0.299R-0.587G+0.886B
R-Y=0.701R-0.587G-0.114B
高清的ITU-R709标准没有沿用标清NTSC矩阵,而是基于D65白光源和ITU-R709色域重新计算了亮度矩阵:
Y=0.2126R+0.7152G+0.0722B
B-Y= -0.212R-0.7152G+0.927B
R-Y= 0.7874R-0.7152G-0.0722B
2.3.2 AFD
在高清频道筹备阶段经常能听到“AFD”,AFD是什么?AFD全称Active Format Description,是在SMPTE 2016-1-2007标准中被规范的。它是一种新型的视频元数据,用以描述电视图像的原始宽高比和图像活动特征信息。它可以存在于在视频的生产、分配和传输过程中,也能在这些过程中被设置。AFD可以嵌入在MPEG视频流、基带SDI信号的辅助数据区和MXF内KLV数据区,电视台在制作和播出时可以使用AFD来达到自适应宽高比的目的。AFD在制作、转换的过程中不会丢失,可以被下一级设备识别。
AFD是一个4bit代码描述视频图片方面的宽高比及其他特点的活动图像的编码帧。全部的活动格式说明如表3、4、5和图12所示。
表3. AFD格式描述
1.在世界范围内某些地区的电视系统可能无法部分或全部支持从‘0001’到‘0111’的AFD码。
2.在16:9的电视格式下,AFD码‘0010’与‘1000’所展现的图像是一样的。AFD码‘1000’在全高清的16:9图像情况下是首选,码‘0010’在北美地区是不被使用的。
3.在16:9的电视格式下,AFD码‘0011’与‘1011’所展现的图像是一样的。AFD码‘1011’在水平中置的14:9图像情况下是首选,码‘0011’在北美地区是不被使用的。
4.在4:3的电视格式下,AFD码‘1001’与‘1000’所展现的图像是一样的。AFD码‘1000’在全4:3图像情况下是首选。
5.AFD码‘1010’是为了实现图像画面不能完全充满当前电视格式画幅但又需要完整显示出图像内容的情况,并因此只能使用信箱(letterbox)模式以充分地显示图像内容。
6.“另类置中(alternative center)”图像使用了原始图像的必要内容区域(参考图1、2、3),此区域外的其它内容对于观众来说意义不大可以被截去。
图12 AFD示图简释
表4. 在4:3电视格式下的AFD图示
表5. 在16:9电视格式下的AFD图示
除了AFD,当电视图像宽高比大于16:9时,还需要Bar Data来表示上图中黑色框的具体信息。由于目前我们电视系统没有使用图像宽高比大于16:9的节目。
AFD可指定的原始数据宽高比可分为4种:16:9、4:3、14:9和其它(需要使用Bar Data具体描述)。AFD可以嵌入在SDI信号切换行后两行至有效图像行前中的任一行正程中,为了留给处理AFD数据尽可能多的时间,它的嵌入在VANC的早期会比较好。AFD和Bar Data组成的辅助数据按照表6来分配。
表6. 用户数据字的组成
AFD和Bar Data按照上诉方法组成的附属数据包(ANC packets),可以放置在切换行后第二行与活动图像前的最后行之间的任意行。因此,对于625/50i系统,它们可以放置在9~23(322~336)行,对于1125/50i系统,它们可以放置在10~21(572~583)行。为了获得最大时间以供处理活动图像的与AFD和Bar Data的关系,因此建议将数据放置在更早的在场辅助数据区(VANC)内。此附属数据包需放置在伴随其定义的视频的每帧中。当此附属数据包置入高清SDI信号时,它应该放置在亮度信号(Y)数据流中。
2.3.3 隐藏字幕
许多广电供应商在推广他们的欧美产品时,常常会提到隐藏字幕,宣称他们的产品支持隐藏字幕,在上、下变换的时候,高标清上下变换器可以自动将隐藏字幕转码到输出格式。这引起了我们招标时极大的兴趣,因为我们大量的节目一旦制作为成品后,画面上留下的字幕、logo等都不方便以后再编辑制作。因此,需要研究一下供应商所提的隐藏字幕究竟是什么。
隐藏式字幕,即Closed Caption。是把文字加入NTSC电视信号的一种标准化编码方法。电视机的内置解码器或独立解码器能显示文字。从1993年以来,在美国销售的每一台尺寸大于13英寸的电视机都可以解码和显示模拟字幕。只要电视机接收到带有字幕的模拟广播电视信号,无论信号来自天线还是直接来自不带机顶盒的有线系统,字幕都能够被显示出来,这给美国大约2200万听力有障碍的消费者带来了福音。那些接收带字幕的数字(ATSC制式)广播信号的数字电视机也能够做到这一点。
多数隐藏字幕和剧本是一样的,里面除了对白之外,还有现时场景的声音和配乐等信息,之所以做隐藏字幕,在国外主要是为了方便有听力障碍的残障人士(通常根据声音发出方位的不同而在屏幕的不同位置出现,不同于普通字幕只出现在画面下部)。
通常Captions出现在说话人物的下方,包含声音和音乐描述。除非使用者激活Closed captions,否则它们不会显示出来。Open captions总是可见的,比如外国录像带上的字幕。
DVD上的Closed Captions由MPEG-2视频流携带,并且自动传送到电视机上。你无法使用DVD播放机来打开或关闭Closed Captions。Subtitles是DVD上的子图像,也就是全屏幕叠盖图形。可以打开32个子图像轨道中的一个,以便在视频顶部显示文字或图形。子图像也可用来创建captions。为了区分NTSC Closed Captions和subtitles,由子图像建立的captions通常被称为“captions for the hearing impaired”。
EIA-608 规定了PAL/NTSC模拟电视上Line21行所包含的caption信息。EIA-708规定了数字电视ATSC/DTV上caption信息的定义。在ATSC/HDTV上则采用Line9来传输caption信息。
3. 高标清上下变换器的测试评估
在上下变换器测试中,通常要考虑图像信号处理的算法和延迟量,在一定的硬件环境下高级的图像运算方法通常也会带来更长的时延。这些算法通常包括去隔行技术、运动补偿技术、宽高比转换技术等。对于图像质量的检测,除了使用一定的测试卡进行客观指标的测量外,对于含有大量运动元素的图像信号很重要的是对其进行主观测试比较。
近来,一些电视台在为系统选择上下变换器时,通常将几家主流的设备集中测试进行主观评价。测试方法采用:标清测试母带进入上变换器后,经过同一个切换台再经过同一公司的下变换器用标清录像机录制用来对比的标清带,同时也在高清切换台输出的地方录制高清上变换信号对比几种上变换器的高清信号。画面选择片花、广告、静态歌曲、动态歌曲等类型。电视台用户强调,主观评测的目的,是希望以一个普通观众的角度,观看图像细节、颜色、边缘等效果。有厂家也提出同样的观点,不能一味强调转换后的技术指标,还要考虑电视观众的观看习惯,因为终端用户并不注重技术指标,而是注重变换的效果,即人眼看上去要感觉舒服,尽量减少电视消费者的疑虑和不满。
此外,众多的非线性编辑软硬件和视频服务器也有高标清上下变换的功能,在测评时也可以把它们多数使用软件的方式来进行高标清上下变换,但与硬件型的高标清上下变换器一样,使用了类似的算法。也要对它们进行测评。
在本章介绍中所用的测试仪器主要有泰克公司WFM700、WVR7120波形监视器、TG700信号发生器和PQA500图像质量分析仪。
对高标清上下变换器的测评可以有多种形式,可以对单个高标清上下变换器的上/下变换格式与性能进行测评,也可以对实际应用中的某个上/下变换通道进行测评,还可以对比较复杂上、下变化组合的通道进行测评。
3.1 SDI格式和接口测试
高、标清电视信号经过高标清上下变换后,信号的编码参数变为输出相应电视信号的格式了。因此,对高标清上下变换后格式和接口的测试,应以输出信号格式的要求为准。此项测试的内容包括有:图像特性、扫描特性、场帧定时光系检测、接口特性和其它格式内容检查。
SDI的格式、接口特性测试的内容属于传统常规性测试,在这里不复述其测试过程。但需要注意的是,由于经过高标清上下变换,我们需要额外关心高标清上下变换后输出的SDI信号其辅助数据格式是否正确。如对于625/50i系统,其6/319行的字0~1439和7/320行的字1444~1723不能放置辅助数据。对于1125/50i系统,其7/569行的字0~1919和8/570行的字1928~2635与0~1919不能放置辅助数据。如果在上述区域放置其它辅助数据,可能会造成电视切换时有“啪”类的破音出现。图像特性、扫描特性和场帧定时关系的检测是为了检查系统输出的SDI信号格式是否符合我国国家标准规定。接口特性测量主要是以眼图测试为基础,针对传输物理层的测试,以检查系统和设备在传输介质中的模拟特性是否达标。
3.2 图像内容监测
由于高标清上下变换有对视频图像的内容进行处理,所以十分有必要对高标清上下变换后的视频图像内容进行检测。主要关注的有高标清上下变换后数字视频信号转换到分量域和复合域上的色域误差,与转换后图像水平分解力的变化。
3.2.1 色域误差监测
WFM700有两种方式的矢量显示可以对色域误差进行检测,一种是传统的矢量显示,由两个色差信号形成矢量图形,主要用于色度相位和幅度的检验;另一种是闪电显示,闪电波形的上部是亮度信号Y和色差Pb形成的,下部是由亮度信号Y和色差Pr形成的,主要用于测量分量信号的幅度和定时。
通过章节2.3.1的介绍,我们知道高清和标清所采用的色域是不同的,其亮度矩阵方程也不同。部分高标清上下变换器在高标清上下变换时需要将YUV色差分量信号换算成RGB分量信号来处理,然后再换算回YUV输出。如果这个过程中所使用亮度矩阵方程有问题,那么就会造成高标清上下变换后颜色的变化。
图13 100%彩条信号经某品牌非编上变换的闪电显示
图14 100%彩条信号经X75某品牌非编上变换的矢量显示
如图13、14所示,是100%标清彩条使用某品牌非编系统进行格式上变换后的闪电和矢量测试。输出信号的分量幅度和色度相位已经大大偏离了标准框范围,偏差很严重,对节目制作的影响很大。主观上通过监视器观察,高标清上下变换后的图像与测试信号图像在颜色方面也有较易察觉的偏差。与此非编厂商的工程师就该问题进行了沟通,厂商最后承认是软件设计上的失误,并在较短时间里通过软件的更新修正了这个问题,保证了节目制作的质量。这个例子也说明了对高标清上下变换器的图像监测是十分有必要的。
3.2.2 图像水平分解力监测
广播电视的扫描参数一经确定,其图像的清晰度和图像信号带宽亦随之确定了。电视图像的分解力通常用能分辨黑白相间线条的线数来表示。电视的分解力又分为垂直分解力和水平分解力。电视图像的垂直分解力受每帧扫描行数的限制,实际上是受每帧显示行数的限制。理想条件下,垂直分解力等于每帧显示行数。但在实际上垂直分解力与当时的图像状态和扫描线的相对位置有关。水平分解力是指图像在水平方向上可以区分出垂直的黑白相间的线条数目。对于电视系统的清晰情况,主要考察其水平分解力。
水平分解力还可以用调制度来衡量。调制度定义为:图像中最大亮度与最小亮度之差和最大亮度与最小亮度之和的比值,用百分比来表示。如调制度趋近为零,表示图像分辨率的黑白线条间距小到几乎分辨不清了。我国标清模拟亮度信号标称带宽为6MHz,对电视系统和设备来说,我们一般考察5MHz和6MHz的调制度;高清模拟亮度信号标称带宽为30MHz,一般考察27MHz的调制度。
当采用信箱模式下变换时,高清信号每行1920个有效图像采样点会变成标清每行720个有效图像采样。高清信号亮度采样频率为74.25MHz(1125/50i格式),标清信号亮度采样频率为13.5MHz。那么原来为12MHz的高清信号下变换后会变成12MHz/(74.25×720)(13.5×1920)≈5.82MHz。当采用切边模式下变换时,高清信号每行1440个有效图像采样点会变成标清每行720个有效图像采样。原来16MHz的高清信号下变换后会变成16MHz/(74.25×720)(13.5×1440)≈5.82MHz。同样,采用镶边模式上变换的标清信号,其6MHz信号会变成16.5MHz。
下面是高清摄像机拍摄的高清多播群测试卡信号经过下变换制作通道后输出进行测试的过程:1.用高清摄像机卡正高清多波群测试卡,使用WFM7000读取高清信号,通过推、拉微调摄像机的构图,使WFM700读到的多波群条频率与测试卡对应的频率相同或相近。2.使用WFM700读取下变换器输出的波形,选择与测试卡对应的可见最高频率16MHz波形群条展开,读取其一个正弦波周期的时间约是0.16us。3.通过f=1/T ,换算出下变换后标清信号的清晰度约为6MHz。
下变换通道的清晰度如图15、16所示
图15 下变换通道的清晰度(内容为高清测试卡的2M~16M)
图16 下变换通道的清晰度(内容为高清测试卡的18M~30M)
由图15可知,图像6MHz左右的调制度大于40%,5MHz左右的调制度大于50%,达到GY/T109.1-1992《广播用CCD摄像系统通用技术条件》甲级标清摄像系统的技术指标。高清前期制作设备经过此下变换通道制作的图像清晰度与一般标清制作的图像清晰度是差别不大的。
此外,本课题还对录像机、摄像机自带的下变换输出以及一款高清非编的下变换输出的多播群信号进行了比较。测试信号使用TG700的10-20M高清多波群测试信号。如图17,高清测试信号被国产某品牌非编采集后,再放在时间线上采用挤压模式生成标清成品后输出图像的亮度信号波形(主要关注其Y信号)。图18是HDCAM高清录像机直接下变换(采用挤压模式)输入高清测试信号的亮度信号波形。图19是某款EPG级高清摄像机拍摄高清多波群测试卡后使用自带下变换功能采取切边模式下变换的图像亮度信号波形。比较图17和18,非编下变换后图像其调制度比录像机要好。主观上看,非编下变换比录像机下变换的画面细节上要清晰些,整体感觉非编下变换要优于录像机下变换。图19的波形调制度过高,原本应该是正弦波形的信号被增强的过分夸张,从监视器上看,图像上有许多让人不舒服的干扰现象,其它主观图像的评价也不好,画面物体边缘部分过渡非常生硬,整体是三者中最差的。
图17 某非编10-20M多波群信号下变换
图18 HDCAM录像机10-20M多波群信号下变换
图19 ENG级摄像机自带下变换的多波群卡画面波形
经过和使用部门的探讨,并大致测评了其它型号和品牌的设置,基本可以得出一个结论:就格式转换质量来说,专业上下变换器和国外高端非编的质量最好,其它非编的上下变换质量也不错,录像机自带的上下变换质量较差,容易看到杂波和边缘的毛刺,摄像机自带的下变换质量更差,录像机和摄像机的上下变换功能不适宜用在电视系统中用于制作。
3.3 AFD检验
许多电视台都期望使用AFD码来对台内的高标清电视信号间高标清上下变换的宽高比进行管理。那么工程技术人员就需要运用仪器来对SDI信号有无携带AFD或携带AFD的内容进行检查。
SMPTE 2016-3-2007对AFD和Bar Data就如何嵌入10bit编码的SDI信号进行了规定。如2.3.2节所描述,AFD和Bar Data组成的附属数据包是放置在场辅助数据区(VANC)中的。根据我国行业标准GY-T 160-2000《数字分量演播室接口中的附属数据信号格式》的规定,附属数据包必须紧随在指明可应用区域开始的EAV或SAV定时基准信号之后。AFD附属数据包属于使用两个字作为数据标识的类型2,这样一个附属数据包的组成为:一个表征附属数据包开始的附属数据标志(ADF);规定附属数据包的用户数据字中所运载的数据性质的数据标识(DID);补充数据标识(SDID)字;数据计数(DC)数目,表示附属数据包中用户数据字的数量;用户数据字(UDW),每个附属数据包中最多255个字;校验和(CS)字。
附属数据标志(ADF)由三个字的序列组成,其数值为:00.0h、FF.Ch、FF.Ch。AFD附属数据包的数据标识(DID)字规定为41h,补充数据标识(SDID)字规定为05h。数据计数(DC)字代表后随的范围为0~255个字的UDW数目,在10比特系统应用时,包含:比特b7~b0运载数据计数值;比特b8为b7~b0的偶校验比特;比特b9为b8的反码。用户数据字(UDW)用来传送由ADF和Bar Data的具体信息(详见2.3.2节)。校验和(CS)字用来确定DID至UDW的附属数据包的有效性,它由10比特组成,9个比特的值及b9,规定如下:比特b8~b0为校验和值;比特b9为b8的反码。
有了上述对AFD附属数据包设置的了解,下面通过实例(泰克公司的WFM700和WVR7120)来介绍如何检查AFD。
WFM700是泰克公司已经推出了好几年的波形监视器,它的数据显示功能可以看到SDI传输的任何数据。将参测信号连接到WFM700上,按下WFM700的MEAS按钮,通过触摸屏和旋钮调整到AFD所在场逆程位置。
测试信号是一段标清素材经过Harris的视频服务器采用Pillarbox模式上变换而成的高清信号。用WFM700看到的数据如下图31所示。
图20 嵌入在第11行的AFD信息
在从0到5采样点的Y和Y’数据字上,分别是000、3FF、3FF、241、205、108,它表示这里放置有AFD附属数据包,采样点6的Y数据字14C即包含AFD具体信息,14C的二进制表示为0,第4~7个bit即为AFD码,内容为1001(在16:9视频图像中对应为Pillarbox 4:3 image, horizontally centered in the coded frame),第8个bit是AR信息,1表示16:9。由于AFD码为1001,因此不需要使用Bar Data信息,因此采样点9至13这5个字全部都是200。最后采样点14为29A,是从采样点3到13所有字的校验和。
使用WVR7120查看AFD附属数据包就更简单了,选择Aux Status Display项目,如图32所示的下半部分,可以直观的看到SMPTE 2016系列标准所规定的AFD及Bar Data内容。
图21 WVR7120的Aux Status 显示
3.4 音/视频延时测量
电视节目是由视频信号和音频信号组成,无论是视频信号还是音频信号,都有可能相应的数据处理或数据缓存引入音/视频延迟。与处理音频信号相比较,视频信号通常需要作更多的处理,这样,在系统中就有可能产生视频对音频的延迟。另外,随着多通道音频的应用,采用音频压缩也日益普遍。而且,帧同步一般至少会引入1帧的延迟。在某些情况下,广播设施中视频和音频信号具有不同的传送路由,有时还要通过不同的分配网络。所有这些,都会造成音/视频延迟。高标清上下变换对视频的处理需要1帧或多帧,也会造成音/视频延时,不管对单个高标清上下变换器还是这个制播通道都需要进行音/视频延时测量以合理设置系统,使音/视频准确同步。
按照ITU-R BT.1359-1建议书《广播声音和图像的相对定时》的说法,从图像源到观察者之间的延迟容差应控制在+90ms至-185ms范围内,也就是说,音频的超前不应超出90ms,音频的滞后不应超出185ms。
使用泰克TG700信号发生器配合WVR7120可以对高清和标清音/视频延时按图22所示来进行测量。TG700的DVG7或HDVG7模块可以产生一串短促的视频脉冲信号,在这组视频信号中嵌入了音频序列,其间隔大约为5秒,将这样的测试信号送入被测系统。音频和视频信号经处理后通过各自的信号通道,最后一起进入WVR7120以测量音频与视频信号之间的定时差。
图22 视音频测试示意图
如图23所示,是广东电视台新闻高清演播室系统录像机主通道的音/视频延时测量结果。其中音频超前了43ms,即2.15场。其结果在ITU-R BT.1359-1建议书《广播声音和图像的相对定时》规定的范围内,表示在被测系统中,音频分量相对其正确的瞬态位置既不超前,也不滞后。
图23 音/视频延时测量
3.5 主观评价
主观评价方式是一种最直观,也是在图像质量评价中最常用的一种评估方法,它是以为人作为图像评估者,直接利用观察者对被测系统质量的主观反应来确定被测系统性能的一种方法。主观评价方法可以参照国家行业标准GY/T 228-2007 《标准清晰度数字电视主观评价用测试图像》和GY/T 134-1998《数字电视图像质量主观评价方法》。用于电视图像质量评价的测试图像、在图像内容上有特定要求。
对于上下变换结果的评价,主要可以考察图像的清晰度、图像层次、肤色及常见色彩的还原、杂波的可见程度、物体的质感、字幕处理能力。可以按照GY/228-2007标准的建议寻找相应的图像来进行评估。
在实际操作中,组织一场正式的主观评价耗费的人力物力比较大。对于在整个电视系统中地位不算特别重要的上下变换器,似乎不大合算。我们期待一种可以重复进行又客观准确的客观测量图像质量的方法。
3.6 用PQA500对图像质量进行客观测量
由于主观测试视频高标清上下变换有一定的复杂性和不确定性,因此,需要一种类似于用于传统电视系统的客观测试仪器。使用客观图像质量测量可以提高测量效率,得到更加精确的测量结果,本节主要探讨和介绍应用泰克公司开发的PQA500客观测试仪对高标清上下变换后的图像质量进行测量和分析的具体方法。
下面以某厂家的下变换高标清上下变换器的DMOS测试来介绍PQA500在高标清上下变换器测量运用的方法和过程1。
图24 下变换测试中Spatial Alignment(空间校准)后的值
** 1 经过与泰克公司工程师的多次沟通,高清下变换的测试中,Reference信号选择下变换后的标清信号,Test信号选择原始信号。
2 由于格式转换器处理下变换时会带来延时,因此用手动方式捕捉视频比较稳妥。
3 虽然PQA500可以自动寻找对齐初始帧,但这样做会消耗大量的计算机资源,因此建议花功夫手动对齐两者的初始帧;并且,由于高清图像序列的计算量非常大,此例子只计算了124帧的数据。
4 由于此例子中采用的下变换模式为切边下变换,标清图像与原始图像的差异还是比较大,该项目设置在20-30之间,有利于PQA500自动准确地搜索出Spatial Alignment(空间校准)的参数。
5 PQA500尝试校准两个视频序列后,有时可能会收到时间校准警告。这是由一系列原因引起的。由于两个序列不在校准范围之内、正在分析平场序列或者测试序列失真,都可导致相关系数较低。如果收到此警告,那么可以通过更改时间校准设置来提高序列之间的相关性(如果相关系数较低的原因是由校准较差引起的)。有关调整域校准设置的详细信息。经过我们多次的实验,下变换的测试数据如图所示其相关性比较好。
图25 下变换DMOS测试结果
图26 下变换PQR测试结果
可惜,在同样方法的上变换测试中,测试序列的DMOS值在前47帧一直处于可以接受的范围附近,但在第47帧后,其PQR和DMOS值陡然上升(如图27、28所示),其结果应该是反映图像此后劣变了,可工程人员从主观上看不出47帧之后有何异样。也许出现这样的结果是我们没有正确设置上变换器参数或与此次使用的PQA500是泰克公司全国演示的Demo机有关。我们希望未来条件允许的情况下再弥补这个小遗憾。但不管如何,PQA500对上下变换器的测试结果也能大致反映出一个事实,上变换的难度比下变换大的多。
图27 上变换PQR测试结果
图28 上变换DMOS测试结果
4. 高标清上下变换在高标清同播时期的应用
上下变换是高标清同播时期必不可少的过程,在如今的高标清兼容系统中广泛运用。在电视台的高清演播室、高清电视转播车、播出系统、总控系统、高清非编网等各种电视系统中,都能看到它的身影。它们是配置在系统的什么位置,全台范围来说应该如何对整个下上变换进行管理,是本章讨论的重点。
4.1 高标清上下变换器在制播系统中的应用
4.1.1 高清演播室
以广东电视台400平方米高清演播室的数字高清改造化项目来看看高标清上下变换器在演播室的应用。为了适应广东电视台节目发展的需要,我们把原来400平方演播室使用的模拟视音频系统更新为高清数字视频系统和数字音频系统。新建的系统是一个有完善备份功能的直播系统。
视频部分有五台松下AK-HC3500MC多格式高清摄像机,使用松下AV-HS5200切换台、PANACEA P32x16HSI矩阵。系统可输入2路外来数字高清和1路外来数字标清信号。可向总控传输1路高清2路标清信号。系统采用EVERTS 7700RD2X2-HD应急开关,采用EVERTS 7714HDC下变换器用于标清录像。系统可同时对高清数字信号和模拟复合信号的监测,可对摄像机输出的信号波形和高清图像监视,还可以通过切换的方式监测各高清数字信源信号和系统输出信号的运行指标。周边视频设备采用Leitch产品,配备了大洋D3-CG HD字幕机一台,设置有6个录放像通道。
视频系统示意图如图29所示,从图上可以看得出,视频系统中,XHD3902-U、X75HD、切换台和7714HDC都有高标清上下变换的作用,前三个将标清信号上变换成高清信号;7714HDC则将高清下变换成标清格式。视频系统主通路采用全带宽串行数字高清信号,考虑到目前标清环境的需求,配置了上变换通道为制作提供节目源,配置了下变换通道可制作和转播标清节目。音频系统分开制作后嵌入SDI进行传输和播出。标清录像机的信号和外来信号需上变换成高清,与AK-HC950高清摄像机、高清录像机、字幕机和非编的高清信号进入Panasonic AV-HS5200 切换台和PANACEA 32×16 矩阵,然后经过2×2倒换器,最后输出高清信号和下变换成标清信号输出。
图29 广东电视台400平米高清演播室视频系统简图
在节目制作过程中,该系统设备运行稳定,扩展性强,使用方便,信号指标正常,从完成改造完成交付使用以来,首先用于我台体育频道的《奥运直播》,随后制作了《五年级插班生》、《十倍钱进》、《心中有数》等高标清节目录像制作以及直播任务。
4.1.2 高清电视转播车
广东电视台数字高清晰度电视转播车设计为18摄像机讯道的大型转播车系统,转播车定位为:(1)能支持2008年北京奥运会足球比赛转播;(2)能够作为主力转播工具支持2010年广州亚运会电视转播;(3)能够支持2009年全运会及其他大型活动电视转播;(4)能够满足台日常转播需要。
从高清电视转播车的定位出发,同时考虑节省投资和提高设备利用率,高标清节目兼容制作将一个不错的选择。因此,高清晰度电视转播车系统设计以负荷同时制作两套不同的高/标清节目为蓝本。系统以中心矩阵为信号调度中心,以主高清切换台为制作核心设计,辅助高清切换台作为主切换台应急和辅助节目/第二套节目制作,输出端采用下变换方式兼容标清信号输出。具备5.1环绕声制作能力、慢动作硬盘录像和重放能力,动态源名跟随指示控制和完善的网络监控。
视频系统设计常驻18个摄像机讯道,经过级联6讯道和8个外来输入可扩展到32个讯道。18个常驻讯道中,14个是常规高清摄像机系统(含5套演播室座机和9套便携机),2个高清高速摄像机讯道,2个高清无线摄像机讯道。与广东电视台现有的电视转播车系统不同的是,系统设计中将14套常规摄像机中的4套设计为飞行箱方式,正常情况下与其他设备共同构成一套完整的EFP系统。EFP系统与转播车主系统具有基本一致的设备配置及操作界面,既可以独立使用也能够通过专用的视音频综合电缆在需要的时候与主系统方便快速地连接使用。视频系统示意图如图30所示:
图30 广东电视台高清电视转播车视频示意图
系统以多码流高标清混合型矩阵作为中心矩阵,这样可以减少输出通道下变换器的数量。作为系统设计中的一个亮点,在矩阵上环接上/下/交叉变换器、解嵌器和嵌入器等,有需要时可以随时灵活调用信号。
中心矩阵一方面作为主切换台输入信号调配,另一方面作为导演区监视等大部分动态调配的监视信号调配。
该车配置的Harris X75、Evertz7700模块、切换台等都可以用来进行上下变换。实际使用中, Harris X75多作为进行上变换加帧同步使用,Evertz7710XUDC板卡主要用来做上变换,7714HDC板卡主要用来做下变换。该车验收完成后,先是参加了2008年北京奥运会足球比赛转播,为BOB提供高清与下变换的标清信号,完成任务后,为广东电视台的制作了许多下变换的标清节目。其整车下变换通道配置合理,转播效果比原数字标清转播车要好。
4.1.3 高清频道播出系统
广东电视台高清频道播出系统(临时)主要有两个部分组成:播出通道和播出服务器。
1、播出通道
主播通道采用高清播出切换台+矩阵播出方式。切换台自带2个內键和1个LOGO,满足播出切换的需要。备通道采用备切换台与下游键相结合的方式,确保在主通道出现故障时,正常播出不受影响。主备两路播出信号具有自动倒换功能,保障了安全播出。倒换后的信号经过编码后通过光纤送给网络公司。
在通道上配置了监测点,送入原有出口监视矩阵,选择后使用高清音频解码器解码监听监看,此监看监听设备同时担负播出机柜线桥等的监看监听功能。所有监看信号通过画面分割板集成后送入LCD监视器进行监看,并带音量显示和告警。PGM信号通过HD-SDI转换HDMI输入主监视器。
2、播出服务器
此次播出服务器系统采用存储搭配MCL播出服务器的方式。存储部分为BML播出媒体资料库,使用具高稳定性的SCSI硬盘保障系统安全播出。系统兼容高标清混播,对外传输采用标准FTP协议,单节点带宽2.4Gbps,利于大量文件的快速传输。编解码部分采用高、标清通用的硬件平台,根据实际需要配置通道数量和类型。
图31 广东卫视高清频道播出系统简图
在播出通道上,使用了Evertz 7710上变换系列模块,另外,HD VCR也有上变换的功能,可以将标清节目磁带上变换成高清SDI进行播出。不过,通过录像机上变换的图像质量比较差,一般不建议使用。高清频道的主要通过视频服务器来播出,系统所选择的视频服务器本身也能将标清节目通过AFD或默认的方式上变换成高清进行播出。
演播室、电视转播车和播出系统在配置和选择拥有上下变换的设置时都有这样的特点:1、系统都是建立在高清SDI平台上的;2、系统的切换台与核心矩阵基本选用可以同时支持高清和标清格式的型号,为高标清节目混用做准备,但大多数情况下不直接输入标清信号进入切换台;3、系统前段靠近输入的格式转换器多选择专用上变换器或类似Harris X75这种多功能处理器;4、系统的后段靠近输出的格式转换器选择专用下变换器。
4.2 高标清上下变换带来的管理问题
4.2.1 宽高比管理
今后几年的一段时间里,高清频道内容完全由高清摄像机前期提供是比较难以实现的。高清前期制作设备在电视行业里普及还远远不够,许多电视工作者还处于高清电视制作的探索阶段。如今的状况是,50%以上的高清频道节目都是由标清摄像机前期拍摄,后期经过上变换至高清而提供的。广电总局的高清发展规划是要求做到高标清同播,最新的《广电总局关于促进高清电视发展的通知》精神是:在高清节目、栏目中使用标清节目素材时,必须按16:9的格式调整。过渡期内,高清频道中的标清上变换节目、栏目,应按4:3格式播出。
有两种方式为高清提供标清素材。一是标清摄像机使用4:3构图方式为高清频道提供素材,使用镶边方式上变换。这种方式使用了100%的原摄像机能力,但填充了75%的高清画面。另一种是标清摄像机使用16:9构图方式为高清频道提供素材,使用拉伸方式上变换。这种方式使用了100%的原摄像机能力,并充满了100%的高清画面。考虑高、标清频道同播,那么只使用了摄像机75%的构图内容和清晰度。这种方式的优点是照顾了高清用户,但标清用户在收看时要么收看到较少的构图内容,要么收看到的节目清晰度比起原来标清频道要大打折扣。
我们需要依次制定恰当的宽高比管理策略。正确的宽高比管理策略可以保护标清观众的利益,不当的上、下变换组合会降低高清制作、标清播出的图像质量。为照顾大多数标清观众的欣赏习惯,高清制作的节目下变换时应采用保证标清电视机画面满幅的切边模式。为保证下变换后的画面构图正常,高清拍摄时需要在16:9的寻像器中加入4:3标志线,取景时画面以4:3构图为主兼顾16:9。
采用切边模式下变换需要注意以下问题:
1.特技。采用高清制作切边模式下变换后部分高清特技的过程会因切边而变得不完整,因此在制作特技时也应该以4:3构图为主,尽量不用从画面的角或边开始的特技。
2.字幕。采用高清制作切边模式下变换后部分高清画面中的字幕会因切边而丢失,或因切边变得不美观,高清画面中的字幕下变换后可能不够清晰。因此在制作字幕时需要在4:3画面范围内布置字幕,字符要够大,适合标清下变换观看。有条件的,要考虑采用分离字幕制作方式,标清/高清播出时分别插入字幕。
4.2.2 音/视频延时的解决
视频在高标清上下变换的时候需要进行大量的数据处理和数据缓冲,就使得经过变换处理以后的视频信号相对于音频信号来说就有一定的延时,通常上下变换延时为1帧到几帧(视乎变换器采用算法的复杂程度和搭载的硬件平台不同有不同的延时量)。相对于音频信号,视频信号滞后不大于1帧时,对观众的影响轻微,可以忽略,但是超出2帧的延时就能让观众感觉到声音画面不同步,在设计系统的时候要充分考虑上下变换引起的视频信号滞后的问题,对音频信号做相应的延时处理,才能够保持声音画面的同步。
在实际的制作当中应用比较多的是标清VTR、标清外来信号(或嵌入音频)上变换到高清输出高清PGM信号,再经下变换到标清输出。经过这样处理的视频信号相对于音频信号有3帧到5帧的滞后(其中含切换台引起的1帧滞后)。在总控与播出系统中,音频多是嵌入在SDI信号中与视频一同传输,且视音频需要处理的部分较少,音/视频延时问题相对没有那么突出。解决音/视频延时有多种方法,对于高标清兼容的制播系统,可以采取以下方式来解决:
1.部分的高标清上下变换器提供音频延时的功能,在高标清上下变换器处理有音频嵌入的SDI时,设置高标清上下变换器对音频进行延时,使之与视频同步。
2.在视音频分开传输时,利用音频系统中数字调音台对相应的音频通道进行音频延时处理。
3.在整个音频系统中引入音频延时器,对需要延时处理的音频进行延时处理。
4.2.3 色域管理
如今的电视广播现状是,在标清电视系统的广播端,实现了NTSC色域拍摄,使用NTSC矩阵编码;在接收机端,使用NTSC矩阵解码,而NTSC色域在显像管上无法实现,实际使用的是比NTSC色域窄EBU与SMPTE C色域电视机。
在高清电视系统的广播端,高清摄像机能够再现NTSC色域,并能用改变矩阵的方法模拟不同的标清和高清色域,系统使用ITU-R709矩阵编码;在接收机端,使用ITU-R709矩阵解码,显像管逐步退出了接收机应用,新型电视机可以显示与显像管相近或更广的色域,采用LED背光的液晶面板甚至能够显示比NTSC更宽的色域。
如图32所示,当分别使用NTSC色域和R709色域拍摄相同色彩时,NTSC色域范围大,得到的彩色饱和度相对低些,R709色域范围小,得到的彩色饱和度相对高些。
图32 不同色域拍摄同一现实色彩的结果
如图33所示,注意图中的红色荷花部分。图(a)用NTSC色域拍摄时彩色饱和度低,能够表现出相近色彩之间的差别,图(b)用R709色域拍摄时彩色饱和度高,不能表现出相近色彩之间的差别。
图33 拍摄图像样本比较
因此,当高清摄像机彩色矩阵设置为ITU-R709标准时,在高清接收机上可以得到正常彩色饱和度的图像,摄像机采用与标清相同的NTSC宽色域拍摄时,下变换图像的彩色饱和度与标清摄像机相同,可以照顾大量标清用户的收看习惯,摄像机设置为NTSC宽色域时,用高清电视机收看的画面彩色饱和度会降低一些
4.2.4 其它设置
从理论上分析,高清制作下变换至标清播出的节目质量应该与同样采用标清系统制作的节目质量差别不大,但在不能恰当设置格式转换设备的情况下,会出现下变换节目的图像质量比标清制作的节目质量还要差的现象。
图34 7714HDC的Scaler Control设置
例如,搭建完成不久的高清转播车系统,上下变换器的进阶设置为默认状态,通过一段时间的使用和测试发现,其下变换出来的标清画面比较柔,感觉清晰度不够好。更改下变换器Evertz 7714HUDC的“Scaler Control”进阶设置(如图34所示),当“H Fitter Cutoff”和“V Fitter Cutoff”项设置靠右参数高的时候,一般画面感觉清晰,细节突出,但图像边缘过渡生硬,容易在图像内容的边缘处出现锯齿;当参数设置靠左或者设置为自动时,画面过渡柔和,但清晰度下降的多。因此,需要找到一个恰当的值使画面较清晰,而有不会边缘过渡生硬、毛糙。
图35 7714HDC的Image Enhancement设置
另外,对图像清晰度产生不同影响的还有变换器信号处理的幅度和频率,相位和频率方式以及对图像运动补偿、相位补偿等处理方式的不同,滤波器的自适应调整能力,以及水平和垂直锐度的补偿等,在上下变换中通过对图像轮廓锐度进行增强校正可以增强图像的亮度细节和彩色细节,这些在Evertz 7714HUDC的“Image Enhancement”项目可以进行设置(如图35)。
4.2.5 小结
上下变换器的选择,最好的是专业的广播级上、下变换器、视频服务器和国外高端非编系统,其次是普通非编系统,不建议使用摄像机和录像机自带的上下变换模块。
可以用AFD管理宽高比,台内AFD的嵌入SDI行逆程的位置应当一致,建议统一放置在第11行。AFD不是万能的,不能代替拍摄、制作时的技术管理策略。
上下变换器应该在使用过程中寻找出恰当的细节和增强设置,以保障节目质量。
在高标清同播的前一两年里:高清迁就标清。高清制作的节目大部分在标清模拟电视频道播出,高清观众是少数,标清观众是多数,应兼顾模拟标清播出的技术标准,照顾大多数标清观众的欣赏习惯。具体措施有:摄像机取景构图以4:3画面为主兼顾16:9;采用切边模式下变换;字幕布置在4:3画面范围内;摄像机可以设置为NTSC或EBU色域;摄像机限幅电平控制在103%或100%;采用高标清兼容的测试信号;合理设置高标清上下变换器
在高标清同播的第三年后:标清迁就高清。用高清制作和播出的节目越来越多,高清观众越来越多,应重点照顾高清观众,兼顾标清观众的收看需求。具体措施有:摄像机取景构图以16:9画面为主兼顾4:3;下变换可以采用切边模式或14:9模式;摄像机色域可选择ITU-R709;摄像机限幅电平提高到103%以上。
5. 总结
5.1 全文总结
高标清格式上下变换本身不算特别复杂的问题,但高标清间格式变换在电视台的应用会带来一系列繁杂的问题需要考虑,如此才能保证我们的高清电视发展的优质安全。在本课题的研究过程中,笔者从高标清上下变换的原理出发,分析对比了现有高标清上下变换器所采用的各种算法,摸索出一套适合高标清格式变换系统的测试项目和方法,以更好的选择高标清上下变换器和更恰当的设置高标清上下变换器。并结合笔者所在电视台的电视车组、制作中心一组、非编科组和新闻中心技术科组的实际工作经验,对高标清格式上下变换的实际应用做出介绍。并针对广东电视台的实际情况给予了一套上下变换管理建议。
本课题研究的上下变换器主要是考虑到我国规定的高、标清电视格式间的转换,而在电视制作特别是体育节目直播,常需要考虑到与国外电视节目交换的需求,这时还需要对帧频的改变进行处理,由于资源有限,笔者还没有能够将之归纳入课题讨论,但帧频改变这个问题对于整个格式转换来说不算难题,这要求本课题将来可以按照同样测评分析思路和管理思路将之归入。
5.2 未来展望
由于本课题目前主要是完成了上下变换图像方面的研究,而高标清混合制播的情况下还要考虑到声音制播相关的问题。比如高清电视还支持5.1环绕声,而标清电视最多体现立体声,二者之间的缩混(下混)与上混也需要考虑到整个高标清间的格式转换中去。
字幕和图像分离播出是我们电视技术工作者和广大电视观众希望看到的,实现它的途径之一就是借用国外的隐藏字幕规范。 EIA-608 和EIA-708标准规定了如何在模拟和数字电视上使用Closed Caption信息。可惜的是,它们所规定的隐藏字幕是针对26个英文字母为基础的语言的,我国不能直接使用。未来需要为之制定相应标准,使之符合GB2312或GB18030的中文字符编码,才有可能使用于广电行业。然后,我们才能再去研究针对于隐藏字幕的高标清上下变换。