光盘刻录
    光盘压制
    光盘印刷
    光盘打印
    DVD 制作
    VCD 制作
    设计包装
    综合报价
    制作流程
    资料下载
    版号申请

  您的位置:/ 首页
   
电视广播中的音频嵌入技术
双击自动滚屏 发布者:wt365 发布时间:2006/11/2 阅读:3173

电视广播中的音频嵌入技术

  天津电视台的全数字音频嵌入(EMBEDDED AUDIO)电视节目播出中心,自1997年开始筹建,于1998年10月1日正式启用运行。三年多的播出实践,充分地体现了电视播出中心数字化的优越性:系统合理、设备稳定、实时播出、准确无误、图象透亮、音质优美、传输无损,达到了预期要求。
  新建的电视播出中心由三个节目分控(节目播控机房)和播出总控(节目调度机房),以及节目传输机房和计划中的直播间组成。分别承担我台三个频道自办节目的播放、调度和传输,以及卫星节目的接收与资料的录制。包括一个预留播控机房,总面积约有550平方米。
  在电视设备由模拟方式向数字化过渡的当今,新建电视播出中心必须搞好定位。首先要保证电视播出的安全优质,还要遵循客观规律,提倡科学、先进、完善、可行。经过一年多的外出调研、方案论证,以及设备选型和安装调试,建成了全数字电视播出中心,任何电视信号或电视节目磁带,进入系统后,均实现数字化的处理和传输。为了适应模拟电视和数字电视并存的现状,在播出中心的构成中,本着不再添置模拟电视设备的原则,利用了部分原有的模拟设备,处理外来的模拟电视信号,经相应的转换设备,与数字系统相通播出,这样无论是模拟信号还是数字信号,都各有各的归宿,在系统中达到“连锁互补”。在实现播出中心全数字化的同时,为保证电视图象和伴音的协调一致,本着科学审慎的态度,敢于创新的精神,采用了音频嵌入新技术,开创了在电视播出系统中使用的先例,取得了很好的效益。
一、 音频嵌入技术在电视 播出系统中的应用
1、 电视播出系统采纳音频嵌 入技术的提出
  随着电视数字理论日趋发展,数字电视设备的逐步深化,在电视信号模数转换和传输的过程中,视频信号和音频信号的处理方式和特点,有着不同的差异,导致数字视频滞后于数字音频,表现在图象和声音不协调和谐的问题也显得明显起来。
  在电视节目播送中,视频信号制约于相应的音频信号,达到互相同步,或利用数字视频信号对数字音频信号加以携带,形成一个有机统一的整体(音频嵌入技术),是我们在数字电视播出系统设计中,极为关心的问题,以使受众得到声画同步的完美的电视图象。 
2、 数字化的电视播出和节目传输中图象伴音协调一致的实现
(1)数字音频信号加以延时,实现音视频的相对协调
  数字电视系统中视频和音频的延时差,可以通过实地测量,在系统中添置相应的音频延时器,达到音视频的协调一致,这是最简易的办法。数字音频延时器有人工预调谐和随视频信号的变化自动控制两种,一般在音视频信号分离的系统中采用。 (2)采用多工复用技术,使音视频信号有机统一
  电视视频信号的模数转换方式,随模拟信号的构成不同(指复合和分量方式),而有一定的差异,数字拾取后的数据传输方式也有并行和串行之分,但都有一个共同的特征,那就是在共同的部位,如视频数字信号的行消隐期间,空余的空间可携带数字信息,在这个空间里,根据不同方式,把数字音频和其他辅助数据加以携带传送。对于数字视频信号来说,数字音频和辅助数据按规定位置相嵌于其身,可称为音频嵌入。
3、 音频嵌入技术在电视播出 系统中的实现
(1)音频嵌入技术在电视播出系统中的实施方案
  如图1所示。通过矩阵开关选择的两路音频嵌入SDI(Serial digital interface)信号,(A1、B1)送至视频处理器作混合或特技切换处理,同样的两路(A2、B2)经解嵌处理的数字音频信号,送至音频处理器作相应的变换,处理后的视频信号和音频信号,再按初始的相对时间关系,在嵌入器中重新将音频信号嵌入。这里要说明的是,整个的处理过程,都是在控制数据处理器的指令下进行工作,以保证时间关系的准确无误。
(2)播控切换台的选择
  具有处理嵌入音频的数字分量串行视频数据流信号(SDI)功能。
具有完善的视频处理、音频处理和灵活的加嵌、解嵌设施,并能达到音视频的统一和谐。
适用于电视节目播出使用。要求结构简单适用,能够实现电视节目播出自动化。
4、 电视节目播出系统方案比较
(1)系统设备设置
  根据中华人民共和国广播电影电视行业标准(GY/T165-2000)《电视中心播控系统数字播出通路技术指标和测量方法》第3、2节数字播出通路(digital transmit channel)规定,数字播出通路是指播控系统中的数字视频、音频信号通路,即从数字信号源(录像机等)、数字分配矩阵、应急切换器、数字切换台(处理器等),到数字信号分配放大器(含无压缩数字信号传输电缆)的通路,见图2。
  一般的播控系统是指各种源信号控制处理形成的电视节目播出信号的设备系统总成。为了实现数字电视节目信号的音视频协调一致,针对电视信号的数字化处理和传输的特点,数字音频信号需加延时器才得以实现。而采用音频嵌入方式的设备系统,在系统的设备构成中,就无需设置音频系统。
(2)设备系统简化
  采用音频嵌入方式的电视播出系统,相对于配有双伴音系统(视频系统,伴音①系统,伴音②系统)的电视播出系统,可以说省掉两套切换开关、处理和分配放大等设备,及相应连接电缆、连接器,故障机率相对减少;也就大大地提高电视播出的安全系数。
(3)节省设备投资 减少了两套音频设备系统和相应的延时器,将节省主要设备投资的2/3。
  采用配有音频嵌入功能的放像机,还要对个别的外来信号配备少量的音频嵌入设备,以及供监听监看的解嵌设备,又要增加部分投资。
对线缆和接插件有严格的要求,这是数字系统必要的。
从总投资来看,播控系统设备,有减少也有增加,可节省一半左右的造价。
(4)问题
  在电视设备模拟模式和数字模式并存的当今,就会有数字电视信号必须通过数模转换,才能在常规的监测系统中监听监看。在电视设备发展进步中,数模转换装置,可在监视设备中内藏,也可外设。
  采用音频嵌入的数字电视系统中的电视信号,必须通过解嵌设施,才能分别看到图象听到声音。
  总之,音频嵌入式电视播出系统,相对系统的音视频分离模式,是有着很多优点,方案是可取的。一般来说,音频嵌入模式适合于较大型系统中的各种切换,达到灵活轻便。切换中的音视频的协调统一,是靠程序控制中央处理器的统一指令完成的,而中央处理器的程序设计很容易实现,运作简单、实用、可靠,在天津电视台的三年多使用实践中予以证实。对于小型系统,音频嵌入也有一定的使用价值,当然要看设备系统的性能价格比和需要而确定。
二、 数字视音频信号
  电视系统数字化的过程,首先要了解数字视频和音频的标准规定,采用音频嵌入技术就必须了解数字视频信号的特征和结构。就此,分析有关数字视频信号的规范标准。
1、 分量数字视频信号
  国际无线电咨询委员会(CCIR)以CCIR601(由于国际无线电咨询委员会被国际电信联盟—ITU所取代,现改称为ITURBT601-2)标准,分别规定了525/59.4和625/50电视系统中,分量视频的取样方案(接口标准)。其中亮度信号的正交取样频率为13.5MHz,两个色差信号Cb和Cr的取样频率为6.75MHz。Cb、Cr与B-Y、R-Y之间有确定的比例关系。
  还要加以说明的是,CCIR601的最初规定,视频信号数据字的精度是8比特。但经过实践考证,在10比特精度下进行处理,会带来许多好处。因此,现已有10比特的接口标准的新规定,与原8比特标准并行使用。
  目前,CCIR601被广泛地采用在电视制作和后期编辑设备中,取得了较好的效果。一般说来,串行方式更加适合于大型系统中使用,现已逐步地取代了并行方式。CCIR601体现了数字与分量工作方式带来的优点。在525行和625行电视系统中的应用,可以获得现阶段的最高质量。
CCIR601规定的视频取样结构,又称4∶2∶2取样。


以图3中的44个象素块来说明601取样,N行的0和2号象素对Y、Cb、Cr都取样,1和3号象素仅对Y取样。这样,在这4个并列的象素中,Y取样了4次,B-Y取样了2次,R-Y也取样了2次,所以601取样又称4∶2∶2。采用4∶2∶2取样的理由是基于人眼视觉系统对色度的分辨率远远低于对亮度的分辨率,如同彩色电视中的色度大面积着色的原理一样。也很容易看出,如果把“4”对应亮度信号的取样频率13.5MHz,那么,“2”对应的色差信号的取样频率正好是6.75MHz。而取样字输出排列顺序为CbY Cr Y CbY Cr Y……,即二个色差取样中夹着一个亮度取样字,或二个亮度信号取样字中夹着一个色差取样字。
  在这里也要说明取样后的量化,若取其取样字的字长为10比特,那么取样电平有1024个台阶。 图4为亮度信号量化示意图。信号中的每一行都存在标准的300mV的行同步信号,都属于“冗余”的部分,所以就没有必要每次都进行取样和量化,可仅以第“0-3”4个码字(量化电平000-003)来表示有效扫描开始,称之为“有效视频起始标志”SAV(Start of Active Video),同样,用第“1020~1023”4个码字(量化电平3FC~3FF)来表示有效行扫描结束,称之为“有效视频结束标志”EAV(End of Active Video)。这样数字接收机以及D/A转换,可方便地利用SVA和EVA同步数字行。更大的好处在于,可将原应用于取样同步信号的约30%的取样点,增加到视频信号电平上。也就是说原应该用约为1000个取样点取样峰峰1V,现可全用在0~700mV的信号电平上,加大了取样密度,提高了取样精度。
  还要指出,除了0~3和1020~1023这8个字用于同步外,第“4~63”(量化电平004~039)这60个字保留给黑电平“下浮”,第“941~1019”(量化电平3AD~3FC)这79个字保留给白电平“过冲”。可见,实际0~700mV为877个量化电平,即877个字(第“64~940”)。黑电平在040量化电平上,白电平在3AC量化电平上。
  在分量数字格式中,无论625/50或525/60,其有效行的象素都定义为720个,根据4∶2∶2取样法则在每个象素上Y都取样,每个有效行上有720个Y取样字。
  图5所示为色差信号的量化。由于第“0~3”、“1020~1023”这8个字所代表的量化电平已用作“SAV”和“EAV”,同样在色差信号的量化中也保留不用。
  同亮度信号量化一样,表示“004~039”量化电平的第“4~63”60个字保留给负电平过冲,而不同的是,只将表示“3CI~3FC”量化电平的第“961~1019”59个字保留给正电平过冲,比亮度信号的白电平过冲少保留20个量化电平。这样色差信号的“-350~+350mV”电平的量化字为897个(第64~960),比亮度信号的“0~700mV”电平的量化多了20个字。
  在色差信号的量化中,零电平在表示量化电平“200”的第512字上,峰负电平在表示量化电平“040”的第64字上,峰正电平在表示量化电平“3CO”的第960字上。
  同样,根据4∶2∶2的取样方式,在有效行的720个象素上,Cb、Cr各有360个取样字。
(1)并行分量数字标准—SMPTE125M/EBUTech3267
  CCIR601(ITU-RBT.601-2)阐述了信号的取样。SMPTE和EBU分别制定了适合于取样的数据电气接口规定。SMPTE制定了525/59.94并行接口规定,称为SMPTE标准125M(早期的RP125标准),而EBUTech 3267则规定了625/50接口(早期的EBUTech 3246标准)。两者都为CCIR所接受,并收入推荐书656。同样现称ITUR BT.656。
  并行接口使用11股绞线,25芯D型连接器。(早期文件规定连接器采用滑扣锁定方式。后来,文件修改为使用4/40固定方式)。这种接口按照Cb、Y、Cr、Y、Cb的顺序,将多路数据字连续发送出去。传送数据率是27M字/秒。在每行上都叠加定时时序SAV和EAV,以表示有效视频的起始点和终点。有效数字行内含720个亮度取样。在有效行中包含了表示行消隐的区间。
  由于EAV和SAV代表了定时信息,因此,没有必要传送通常的同步信号。行消隐区(也包含场消隐区中的行正程)可以用于传送辅助数据。在这个数据空间是可以用来携带数字音频信息的。SMPTE也制定了相应的文件,对音频数据包的格式和分配标准作了规定。
(2)串行分量数字信号
  数字设备的并行接口连接方式有线缆和特征的局限,通常只能适合于相当小型的设备。很明显,在大型设备和电视系统中,需要采用一种能通过一条同轴电缆串行传送的方式。因为传送数据率很高,所以,实现起来并不简单。如果信号不经过处理就串行传送,要可靠地恢复原信号就很困难,因此在传送前,串行信号必须经过修正,以保证足够的边沿。
  一种新型的,采用扰频和变换到NRZI的接口,现在已被SMPTE(SMPTE259M)和EBU(TECH326)采纳为标准。这种接口接受修正并行接口送来的10比特信号,传送比特率为270Mb/S的数字分量串行信号(SDI)。分量信号不需要进一步处理。这是因为并行接口中的SAV和EAV信号,提供了统一的时序。它能够识别串行区域,以便形成字帧信号。如果辅助数据(例如伴音信号)已插入并行信号,则该数据可以被串行接口传送。这种串行接口可以使用普通的视频同轴电缆。
(3)分量数字视频信号的水平行
  图6所示,表明了分量数字视频信号水平行取样字的位置。我们知道,在有效行中有720个Y取样字,分别有360个Cb和Cr取样字,总共有1440个取样字(0~1439)。行消隐期间,525/60可安排276个取样字,625/50可安排288个取样字。这样,对于一个水平行,525/60有1716个取样字,625/50有1728个取样字。
  在行消隐期间表示“SAV”和“EAV”的4个码字,前3个字相同,都是3FF/000/000,不同的是称作“XYZ”的第4个字。在“XYZ”字中其第8比特(F比特)的状态表征所取样的行在奇数场或偶数场,第7比特(V比特)的状态表征所取样的行在场消隐期间或正程期间,第6比特(H比特)的状态表征是“SAV”还是“EAV”。另有6个比特用于比特纠错。
(4)NRZ码对NRZI码的转换
  分量数字视频信号(D1格式)的半行方式输出时,产生的270Mb/s码流为不归零码(NRZ码)。NRZ码的逻辑“0”并非真正的“0”电平(如0mV),而仅指输出低电平,同样,逻辑“1”也并非真正的“1”电平(如700mV等),而仅指输出的高电平。这意味着NRZ码对极性很敏感,传送中的噪声电平都会产生错误的“0”和“1”。另外,NRZ码对接收机和D/A转换器的常“0”和常“1”码的运行也束手无策。码流中当出现常“0”和常“1”码的运行时,意味着码流中低频成分很丰富,即常“0”和常“1”运行期间不发生取样时钟的跳变,这时接收机和D/A转换器的锁相环的本振,由于得不到时钟信息的修正而漂移,进而造成锁相环失锁,从而产生严重的接收误码。通过对NRZ码进行加扰,能去除NRZ码的这两个缺陷。加扰的数字方程式为G1(x)=x9+x4+1和G2(x)=x+1(G1为扰频输出,G2为NRZI编码器输出)。加扰后的NRZ码变为NRZ1码,称之为倒相不归零码。NRZ1码的特点是,不把输出的高、低电平分别看作“1”和“0”,而仅把高、低电平之间的变化认作“1”和“0”,对高、低电平的极性不再敏感。NRZ1码的另一个优点是,通过NRZ码的加扰,打破常“0”和常“1”的运行,使“1”和“0”的比值非常接近1,为接收机和D/A转换器产生了最多的过零点(即提供了丰富的时钟信息),使接收机和D/A转换器锁相环与取样时钟紧紧相锁,保证工作正常。扰频是适用于串行数据传输的一项技术,是在取样并行数据转为串行码流的过程中实现的。
  图7表示模拟信号取样的并行数据是怎样产生半行数据流信号的过程。并行时钟用于把取样数据输入移相寄存器,以十倍于并行时钟的速率,将比特位传递下去。在每十位数据字中,首先传递LSB(最低有效位),如果输入端的可用数据只有8位,则串行编码器在最后两位置零,以产生完整的十位字(在图7中,MSB表示最高有效位。)
2、 复合数字视频信号
  数字技术初始实验阶段,都是基于对复合模拟信号(NTSC或PAL)进行取样,在实际操作中确认,为了取得最高的质量,还必须采用分量方式处理。于是产生的第一个数字标准,就是分量标准。直至宣告推出称之为D2格式的复合数字录像机系统后,复合数字格式又重新引起界内人士进一步研讨实验的兴趣。最初设计这种机器的目的,是作为模拟信号(NTSC或PAL)系统中的输入输出设备使用。采用数字式的输入输出设备进行机对机的多代复制,可收到很好的效果。因此,逐渐地出现了一系列的各种类型的制作设备。
  复合数字视频信号以4倍副载波频率进行取样。NTSC制标称取样频率14.3MHz,而PAL制为17.7MHz。与分量接口一样,复合数字信号的有效行中足以表示模拟信号的有效行和消隐信号。与分量接口不同的是,复合接口发送的数字信号表示行消隐期间的普通同步和色同步信号。在复合接口上还传递表示场同步和均衡脉冲的数字信息。
  复合数字设备具有数字处理和接口的各种优点,尤其是数字录像的多代复制性能。但也存在一些局限性,由于是对复合模拟信号直接取样,就保留了NTSC制和PAL制编码方式的烙印,其固有的缺陷,也是无法解决的。
(1) 并行复合数字信号
  与分量数字方式一样,并行复合接口使用多芯电缆和25芯“D”型连接器。实践证明,对于小型和中型规模的设备还能适应,但对大型设备而言,还是需要串行接口。NTSC制的复合数字并行接口标准是SMPTE 244M,EBU也有关于PAL制的接口标准。两种接口标准都规定为10比特的精度。
(2) 串行复合数字信号
  SMPTE 259M阐述的扰频NRZI串行接口,也可用来传送复合数字信号。从10比特并行接口来的数据,经过串接,按分量接口使用用同样算法经过扰频处理,变换为NRZI信号。最终的数据率为:NTSC是143Mb/s,PAL是177Mb/s。
  与分量信号相比,复合信号从并行到串行的变换稍微复杂一些。在并行分量接口中的SAV和EAV信号提供了独特的序列,能够在串行信号流中被识别出来,而并行复合接口并不具备这样的信号,因此,必须在串接前,在并行信号中插入适当的定时基准信号(TRS)于同步顶位置,用3个字表示TRS信号,以保证在串行接收机中实现成帧,然后在接收机中再去掉TRS信号。
  复合并行接口不具备发送附加数据的能力,由于发送同步和色同步信息占据了较多的数据空间,相对插入数据空间变小了。从并行转到串行的过程中,辅助数据可以插在同步顶位置。该数据空间足够发送4个通道的AES/EBU数字音频信号(两组立体声信号)。诸如音频信号之类的附加信号,可以预先在信号串接时加入,这个过程通常是利用插入TRS信号的同一个公用处理器实现的。
3、 数字音频
  在分析了数字视频信号的基础上,让我们再看一看被嵌入的音频信号的具体表征。
  1992年,美国音频工程师协会(AES)和欧洲广播联盟(EBU)共同制定了数字音频的接口标准,即AES/EBU数字音频格式。在这个基础上,国际电信联盟将其归纳为ITU-R BS647-2号建议书《广播演播室数字音频信号的接口》(A DIGITAL AUDIO INTERFACE FOR BROADCASTING STUDIOS)。
  AES/EBU音频被广泛地使用在演播室的各种数字音频设备间,数字域内的相互联接之中。就是我们谈及的嵌入音频,具体的音频格式,将在音频嵌入部分中详细表述。
  当讨论数字音频时,最重要的考虑问题之一,就是每个取样的二进制数的个数,当视频按每个取样为8位或10位二进制数时,音频设备的位数范围应该是16~20位,以提高所需要的动态范围和信杂比(SNR)。确定数字音频信杂比SNR的基本公式是:
SNR=(6.02×n)+1.76(dB)
式中“n”是每个取样二进制数的位数
  对于16位系统,最高理论SNR应为(6.02×16)+1.76=98.08dB,18位系统SNR为110.2dB,20位系统SNR为122.16dB。不难看出,一个设计优良的音频设备系统,若能取得100~110 dB的信杂比,按公式计算,SNR为110 dB时,该系统具有的等效分解力为18.3比特(位).
 
                                    
电视广播中的音频嵌入技术

  天津电视台的全数字音频嵌入(EMBEDDED AUDIO)电视节目播出中心,自1997年开始筹建,于1998年10月1日正式启用运行。三年多的播出实践,充分地体现了电视播出中心数字化的优越性:系统合理、设备稳定、实时播出、准确无误、图象透亮、音质优美、传输无损,达到了预期要求。
  新建的电视播出中心由三个节目分控(节目播控机房)和播出总控(节目调度机房),以及节目传输机房和计划中的直播间组成。分别承担我台三个频道自办节目的播放、调度和传输,以及卫星节目的接收与资料的录制。包括一个预留播控机房,总面积约有550平方米。
  在电视设备由模拟方式向数字化过渡的当今,新建电视播出中心必须搞好定位。首先要保证电视播出的安全优质,还要遵循客观规律,提倡科学、先进、完善、可行。经过一年多的外出调研、方案论证,以及设备选型和安装调试,建成了全数字电视播出中心,任何电视信号或电视节目磁带,进入系统后,均实现数字化的处理和传输。为了适应模拟电视和数字电视并存的现状,在播出中心的构成中,本着不再添置模拟电视设备的原则,利用了部分原有的模拟设备,处理外来的模拟电视信号,经相应的转换设备,与数字系统相通播出,这样无论是模拟信号还是数字信号,都各有各的归宿,在系统中达到“连锁互补”。在实现播出中心全数字化的同时,为保证电视图象和伴音的协调一致,本着科学审慎的态度,敢于创新的精神,采用了音频嵌入新技术,开创了在电视播出系统中使用的先例,取得了很好的效益。
一、 音频嵌入技术在电视 播出系统中的应用
1、 电视播出系统采纳音频嵌 入技术的提出
  随着电视数字理论日趋发展,数字电视设备的逐步深化,在电视信号模数转换和传输的过程中,视频信号和音频信号的处理方式和特点,有着不同的差异,导致数字视频滞后于数字音频,表现在图象和声音不协调和谐的问题也显得明显起来。
  在电视节目播送中,视频信号制约于相应的音频信号,达到互相同步,或利用数字视频信号对数字音频信号加以携带,形成一个有机统一的整体(音频嵌入技术),是我们在数字电视播出系统设计中,极为关心的问题,以使受众得到声画同步的完美的电视图象。 
2、 数字化的电视播出和节目传输中图象伴音协调一致的实现
(1)数字音频信号加以延时,实现音视频的相对协调
  数字电视系统中视频和音频的延时差,可以通过实地测量,在系统中添置相应的音频延时器,达到音视频的协调一致,这是最简易的办法。数字音频延时器有人工预调谐和随视频信号的变化自动控制两种,一般在音视频信号分离的系统中采用。 (2)采用多工复用技术,使音视频信号有机统一
  电视视频信号的模数转换方式,随模拟信号的构成不同(指复合和分量方式),而有一定的差异,数字拾取后的数据传输方式也有并行和串行之分,但都有一个共同的特征,那就是在共同的部位,如视频数字信号的行消隐期间,空余的空间可携带数字信息,在这个空间里,根据不同方式,把数字音频和其他辅助数据加以携带传送。对于数字视频信号来说,数字音频和辅助数据按规定位置相嵌于其身,可称为音频嵌入。
3、 音频嵌入技术在电视播出 系统中的实现
(1)音频嵌入技术在电视播出系统中的实施方案
  如图1所示。通过矩阵开关选择的两路音频嵌入SDI(Serial digital interface)信号,(A1、B1)送至视频处理器作混合或特技切换处理,同样的两路(A2、B2)经解嵌处理的数字音频信号,送至音频处理器作相应的变换,处理后的视频信号和音频信号,再按初始的相对时间关系,在嵌入器中重新将音频信号嵌入。这里要说明的是,整个的处理过程,都是在控制数据处理器的指令下进行工作,以保证时间关系的准确无误。
(2)播控切换台的选择
  具有处理嵌入音频的数字分量串行视频数据流信号(SDI)功能。
具有完善的视频处理、音频处理和灵活的加嵌、解嵌设施,并能达到音视频的统一和谐。
适用于电视节目播出使用。要求结构简单适用,能够实现电视节目播出自动化。
4、 电视节目播出系统方案比较
(1)系统设备设置
  根据中华人民共和国广播电影电视行业标准(GY/T165-2000)《电视中心播控系统数字播出通路技术指标和测量方法》第3、2节数字播出通路(digital transmit channel)规定,数字播出通路是指播控系统中的数字视频、音频信号通路,即从数字信号源(录像机等)、数字分配矩阵、应急切换器、数字切换台(处理器等),到数字信号分配放大器(含无压缩数字信号传输电缆)的通路,见图2。
  一般的播控系统是指各种源信号控制处理形成的电视节目播出信号的设备系统总成。为了实现数字电视节目信号的音视频协调一致,针对电视信号的数字化处理和传输的特点,数字音频信号需加延时器才得以实现。而采用音频嵌入方式的设备系统,在系统的设备构成中,就无需设置音频系统。
(2)设备系统简化
  采用音频嵌入方式的电视播出系统,相对于配有双伴音系统(视频系统,伴音①系统,伴音②系统)的电视播出系统,可以说省掉两套切换开关、处理和分配放大等设备,及相应连接电缆、连接器,故障机率相对减少;也就大大地提高电视播出的安全系数。
(3)节省设备投资 减少了两套音频设备系统和相应的延时器,将节省主要设备投资的2/3。
  采用配有音频嵌入功能的放像机,还要对个别的外来信号配备少量的音频嵌入设备,以及供监听监看的解嵌设备,又要增加部分投资。
对线缆和接插件有严格的要求,这是数字系统必要的。
从总投资来看,播控系统设备,有减少也有增加,可节省一半左右的造价。
(4)问题
  在电视设备模拟模式和数字模式并存的当今,就会有数字电视信号必须通过数模转换,才能在常规的监测系统中监听监看。在电视设备发展进步中,数模转换装置,可在监视设备中内藏,也可外设。
  采用音频嵌入的数字电视系统中的电视信号,必须通过解嵌设施,才能分别看到图象听到声音。
  总之,音频嵌入式电视播出系统,相对系统的音视频分离模式,是有着很多优点,方案是可取的。一般来说,音频嵌入模式适合于较大型系统中的各种切换,达到灵活轻便。切换中的音视频的协调统一,是靠程序控制中央处理器的统一指令完成的,而中央处理器的程序设计很容易实现,运作简单、实用、可靠,在天津电视台的三年多使用实践中予以证实。对于小型系统,音频嵌入也有一定的使用价值,当然要看设备系统的性能价格比和需要而确定。
二、 数字视音频信号
  电视系统数字化的过程,首先要了解数字视频和音频的标准规定,采用音频嵌入技术就必须了解数字视频信号的特征和结构。就此,分析有关数字视频信号的规范标准。
1、 分量数字视频信号
  国际无线电咨询委员会(CCIR)以CCIR601(由于国际无线电咨询委员会被国际电信联盟—ITU所取代,现改称为ITURBT601-2)标准,分别规定了525/59.4和625/50电视系统中,分量视频的取样方案(接口标准)。其中亮度信号的正交取样频率为13.5MHz,两个色差信号Cb和Cr的取样频率为6.75MHz。Cb、Cr与B-Y、R-Y之间有确定的比例关系。
  还要加以说明的是,CCIR601的最初规定,视频信号数据字的精度是8比特。但经过实践考证,在10比特精度下进行处理,会带来许多好处。因此,现已有10比特的接口标准的新规定,与原8比特标准并行使用。
  目前,CCIR601被广泛地采用在电视制作和后期编辑设备中,取得了较好的效果。一般说来,串行方式更加适合于大型系统中使用,现已逐步地取代了并行方式。CCIR601体现了数字与分量工作方式带来的优点。在525行和625行电视系统中的应用,可以获得现阶段的最高质量。
CCIR601规定的视频取样结构,又称4∶2∶2取样。


以图3中的44个象素块来说明601取样,N行的0和2号象素对Y、Cb、Cr都取样,1和3号象素仅对Y取样。这样,在这4个并列的象素中,Y取样了4次,B-Y取样了2次,R-Y也取样了2次,所以601取样又称4∶2∶2。采用4∶2∶2取样的理由是基于人眼视觉系统对色度的分辨率远远低于对亮度的分辨率,如同彩色电视中的色度大面积着色的原理一样。也很容易看出,如果把“4”对应亮度信号的取样频率13.5MHz,那么,“2”对应的色差信号的取样频率正好是6.75MHz。而取样字输出排列顺序为CbY Cr Y CbY Cr Y……,即二个色差取样中夹着一个亮度取样字,或二个亮度信号取样字中夹着一个色差取样字。
  在这里也要说明取样后的量化,若取其取样字的字长为10比特,那么取样电平有1024个台阶。 图4为亮度信号量化示意图。信号中的每一行都存在标准的300mV的行同步信号,都属于“冗余”的部分,所以就没有必要每次都进行取样和量化,可仅以第“0-3”4个码字(量化电平000-003)来表示有效扫描开始,称之为“有效视频起始标志”SAV(Start of Active Video),同样,用第“1020~1023”4个码字(量化电平3FC~3FF)来表示有效行扫描结束,称之为“有效视频结束标志”EAV(End of Active Video)。这样数字接收机以及D/A转换,可方便地利用SVA和EVA同步数字行。更大的好处在于,可将原应用于取样同步信号的约30%的取样点,增加到视频信号电平上。也就是说原应该用约为1000个取样点取样峰峰1V,现可全用在0~700mV的信号电平上,加大了取样密度,提高了取样精度。
  还要指出,除了0~3和1020~1023这8个字用于同步外,第“4~63”(量化电平004~039)这60个字保留给黑电平“下浮”,第“941~1019”(量化电平3AD~3FC)这79个字保留给白电平“过冲”。可见,实际0~700mV为877个量化电平,即877个字(第“64~940”)。黑电平在040量化电平上,白电平在3AC量化电平上。
  在分量数字格式中,无论625/50或525/60,其有效行的象素都定义为720个,根据4∶2∶2取样法则在每个象素上Y都取样,每个有效行上有720个Y取样字。
  图5所示为色差信号的量化。由于第“0~3”、“1020~1023”这8个字所代表的量化电平已用作“SAV”和“EAV”,同样在色差信号的量化中也保留不用。
  同亮度信号量化一样,表示“004~039”量化电平的第“4~63”60个字保留给负电平过冲,而不同的是,只将表示“3CI~3FC”量化电平的第“961~1019”59个字保留给正电平过冲,比亮度信号的白电平过冲少保留20个量化电平。这样色差信号的“-350~+350mV”电平的量化字为897个(第64~960),比亮度信号的“0~700mV”电平的量化多了20个字。
  在色差信号的量化中,零电平在表示量化电平“200”的第512字上,峰负电平在表示量化电平“040”的第64字上,峰正电平在表示量化电平“3CO”的第960字上。
  同样,根据4∶2∶2的取样方式,在有效行的720个象素上,Cb、Cr各有360个取样字。
(1)并行分量数字标准—SMPTE125M/EBUTech3267
  CCIR601(ITU-RBT.601-2)阐述了信号的取样。SMPTE和EBU分别制定了适合于取样的数据电气接口规定。SMPTE制定了525/59.94并行接口规定,称为SMPTE标准125M(早期的RP125标准),而EBUTech 3267则规定了625/50接口(早期的EBUTech 3246标准)。两者都为CCIR所接受,并收入推荐书656。同样现称ITUR BT.656。
  并行接口使用11股绞线,25芯D型连接器。(早期文件规定连接器采用滑扣锁定方式。后来,文件修改为使用4/40固定方式)。这种接口按照Cb、Y、Cr、Y、Cb的顺序,将多路数据字连续发送出去。传送数据率是27M字/秒。在每行上都叠加定时时序SAV和EAV,以表示有效视频的起始点和终点。有效数字行内含720个亮度取样。在有效行中包含了表示行消隐的区间。
  由于EAV和SAV代表了定时信息,因此,没有必要传送通常的同步信号。行消隐区(也包含场消隐区中的行正程)可以用于传送辅助数据。在这个数据空间是可以用来携带数字音频信息的。SMPTE也制定了相应的文件,对音频数据包的格式和分配标准作了规定。
(2)串行分量数字信号
  数字设备的并行接口连接方式有线缆和特征的局限,通常只能适合于相当小型的设备。很明显,在大型设备和电视系统中,需要采用一种能通过一条同轴电缆串行传送的方式。因为传送数据率很高,所以,实现起来并不简单。如果信号不经过处理就串行传送,要可靠地恢复原信号就很困难,因此在传送前,串行信号必须经过修正,以保证足够的边沿。
  一种新型的,采用扰频和变换到NRZI的接口,现在已被SMPTE(SMPTE259M)和EBU(TECH326)采纳为标准。这种接口接受修正并行接口送来的10比特信号,传送比特率为270Mb/S的数字分量串行信号(SDI)。分量信号不需要进一步处理。这是因为并行接口中的SAV和EAV信号,提供了统一的时序。它能够识别串行区域,以便形成字帧信号。如果辅助数据(例如伴音信号)已插入并行信号,则该数据可以被串行接口传送。这种串行接口可以使用普通的视频同轴电缆。
(3)分量数字视频信号的水平行
  图6所示,表明了分量数字视频信号水平行取样字的位置。我们知道,在有效行中有720个Y取样字,分别有360个Cb和Cr取样字,总共有1440个取样字(0~1439)。行消隐期间,525/60可安排276个取样字,625/50可安排288个取样字。这样,对于一个水平行,525/60有1716个取样字,625/50有1728个取样字。
  在行消隐期间表示“SAV”和“EAV”的4个码字,前3个字相同,都是3FF/000/000,不同的是称作“XYZ”的第4个字。在“XYZ”字中其第8比特(F比特)的状态表征所取样的行在奇数场或偶数场,第7比特(V比特)的状态表征所取样的行在场消隐期间或正程期间,第6比特(H比特)的状态表征是“SAV”还是“EAV”。另有6个比特用于比特纠错。
(4)NRZ码对NRZI码的转换
  分量数字视频信号(D1格式)的半行方式输出时,产生的270Mb/s码流为不归零码(NRZ码)。NRZ码的逻辑“0”并非真正的“0”电平(如0mV),而仅指输出低电平,同样,逻辑“1”也并非真正的“1”电平(如700mV等),而仅指输出的高电平。这意味着NRZ码对极性很敏感,传送中的噪声电平都会产生错误的“0”和“1”。另外,NRZ码对接收机和D/A转换器的常“0”和常“1”码的运行也束手无策。码流中当出现常“0”和常“1”码的运行时,意味着码流中低频成分很丰富,即常“0”和常“1”运行期间不发生取样时钟的跳变,这时接收机和D/A转换器的锁相环的本振,由于得不到时钟信息的修正而漂移,进而造成锁相环失锁,从而产生严重的接收误码。通过对NRZ码进行加扰,能去除NRZ码的这两个缺陷。加扰的数字方程式为G1(x)=x9+x4+1和G2(x)=x+1(G1为扰频输出,G2为NRZI编码器输出)。加扰后的NRZ码变为NRZ1码,称之为倒相不归零码。NRZ1码的特点是,不把输出的高、低电平分别看作“1”和“0”,而仅把高、低电平之间的变化认作“1”和“0”,对高、低电平的极性不再敏感。NRZ1码的另一个优点是,通过NRZ码的加扰,打破常“0”和常“1”的运行,使“1”和“0”的比值非常接近1,为接收机和D/A转换器产生了最多的过零点(即提供了丰富的时钟信息),使接收机和D/A转换器锁相环与取样时钟紧紧相锁,保证工作正常。扰频是适用于串行数据传输的一项技术,是在取样并行数据转为串行码流的过程中实现的。
  图7表示模拟信号取样的并行数据是怎样产生半行数据流信号的过程。并行时钟用于把取样数据输入移相寄存器,以十倍于并行时钟的速率,将比特位传递下去。在每十位数据字中,首先传递LSB(最低有效位),如果输入端的可用数据只有8位,则串行编码器在最后两位置零,以产生完整的十位字(在图7中,MSB表示最高有效位。)
2、 复合数字视频信号
  数字技术初始实验阶段,都是基于对复合模拟信号(NTSC或PAL)进行取样,在实际操作中确认,为了取得最高的质量,还必须采用分量方式处理。于是产生的第一个数字标准,就是分量标准。直至宣告推出称之为D2格式的复合数字录像机系统后,复合数字格式又重新引起界内人士进一步研讨实验的兴趣。最初设计这种机器的目的,是作为模拟信号(NTSC或PAL)系统中的输入输出设备使用。采用数字式的输入输出设备进行机对机的多代复制,可收到很好的效果。因此,逐渐地出现了一系列的各种类型的制作设备。
  复合数字视频信号以4倍副载波频率进行取样。NTSC制标称取样频率14.3MHz,而PAL制为17.7MHz。与分量接口一样,复合数字信号的有效行中足以表示模拟信号的有效行和消隐信号。与分量接口不同的是,复合接口发送的数字信号表示行消隐期间的普通同步和色同步信号。在复合接口上还传递表示场同步和均衡脉冲的数字信息。
  复合数字设备具有数字处理和接口的各种优点,尤其是数字录像的多代复制性能。但也存在一些局限性,由于是对复合模拟信号直接取样,就保留了NTSC制和PAL制编码方式的烙印,其固有的缺陷,也是无法解决的。
(1) 并行复合数字信号
  与分量数字方式一样,并行复合接口使用多芯电缆和25芯“D”型连接器。实践证明,对于小型和中型规模的设备还能适应,但对大型设备而言,还是需要串行接口。NTSC制的复合数字并行接口标准是SMPTE 244M,EBU也有关于PAL制的接口标准。两种接口标准都规定为10比特的精度。
(2) 串行复合数字信号
  SMPTE 259M阐述的扰频NRZI串行接口,也可用来传送复合数字信号。从10比特并行接口来的数据,经过串接,按分量接口使用用同样算法经过扰频处理,变换为NRZI信号。最终的数据率为:NTSC是143Mb/s,PAL是177Mb/s。
  与分量信号相比,复合信号从并行到串行的变换稍微复杂一些。在并行分量接口中的SAV和EAV信号提供了独特的序列,能够在串行信号流中被识别出来,而并行复合接口并不具备这样的信号,因此,必须在串接前,在并行信号中插入适当的定时基准信号(TRS)于同步顶位置,用3个字表示TRS信号,以保证在串行接收机中实现成帧,然后在接收机中再去掉TRS信号。
  复合并行接口不具备发送附加数据的能力,由于发送同步和色同步信息占据了较多的数据空间,相对插入数据空间变小了。从并行转到串行的过程中,辅助数据可以插在同步顶位置。该数据空间足够发送4个通道的AES/EBU数字音频信号(两组立体声信号)。诸如音频信号之类的附加信号,可以预先在信号串接时加入,这个过程通常是利用插入TRS信号的同一个公用处理器实现的。
3、 数字音频
  在分析了数字视频信号的基础上,让我们再看一看被嵌入的音频信号的具体表征。
  1992年,美国音频工程师协会(AES)和欧洲广播联盟(EBU)共同制定了数字音频的接口标准,即AES/EBU数字音频格式。在这个基础上,国际电信联盟将其归纳为ITU-R BS647-2号建议书《广播演播室数字音频信号的接口》(A DIGITAL AUDIO INTERFACE FOR BROADCASTING STUDIOS)。
  AES/EBU音频被广泛地使用在演播室的各种数字音频设备间,数字域内的相互联接之中。就是我们谈及的嵌入音频,具体的音频格式,将在音频嵌入部分中详细表述。
  当讨论数字音频时,最重要的考虑问题之一,就是每个取样的二进制数的个数,当视频按每个取样为8位或10位二进制数时,音频设备的位数范围应该是16~20位,以提高所需要的动态范围和信杂比(SNR)。确定数字音频信杂比SNR的基本公式是:
SNR=(6.02×n)+1.76(dB)
式中“n”是每个取样二进制数的位数
  对于16位系统,最高理论SNR应为(6.02×16)+1.76=98.08dB,18位系统SNR为110.2dB,20位系统SNR为122.16dB。不难看出,一个设计优良的音频设备系统,若能取得100~110 dB的信杂比,按公式计算,SNR为110 dB时,该系统具有的等效分解力为18.3比特(位).
 
                                    
 
 

我们提供光盘制作 光盘刻录 光盘印刷 多媒体制作 光盘复制 光盘打印 名片光盘 宣传片制作 盘面印刷等服务!