即时字幕广播
来自维基百科,自由的百科全书
即时字幕广播(或称实时字幕广播),为制作并添加字幕于正在播出的画面上(“电视资讯”)的系统。本条目主要介绍可以在接收器上切换的日本电视广播。
概述
日本的字幕广播是自1990年代开始才适用于事前录制的电视节目[1]。但一个30分钟的节目需要花费约3天至4天添加字幕[2],即时后来引进使用文字处理器处理即时字幕的技术,但由于存在输入速度和精准度的问题,因此很难投入实际使用。[3]。
1997年,邮政省要求即时字幕广播须于2007年前扩展至所有电视节目,但新闻节目与体育赛事直播等现场直播的节目则除外[4]。
此外,于带有字幕的直播节目中,若使用的语言是表音文字则可以使用语音辨识,但日本等地使用的是表意文字,由于存在仪器和技术问题,也使该政策难以实现。
为了使听障人士与高龄者可以无障碍的接收资讯,NHK放送技术研究所开发了用于字幕广播的语音辨识软件。2000年3月27日开始,于NHK播出的一部分节目开始实施即时字幕广播[注 1],而目前其他的商业电视台(截至2013年为日本电视台、TBS、富士电视台、朝日电视台、东京电视台各系列局与播出同节目的电视网的独立局与部分的BS放送局与CS放送局)与提供网络电视串流媒体服务的AbemaTV也已实施这个服务。
原理
即时字幕广播的原理主要有两者,一种是由人听取在以键盘输入文字,另一种则是引入语音辨识系统以生成字幕,此两种方式目前皆存在。
除了字幕生成的过程以外,通常字幕广播生成的文字会与当时画面播出的文字等资讯重叠并透过电波传递。而通常采用即时生成的字幕时延迟是无法避免的,字幕有时会在发声后数秒后才显示。
由被称为“速记字幕员”的文字听打员与听取声音的同时输入文字。而输入字幕的工作通常由多人分担,但负责内容的划分依方式不同而不同。
主要有两种方法。
- 使用一般键盘输入
- 以摘要转录的方式输入字幕。由许多的文字听打员人轮流输入字幕。由于此种输入方式使用一般的OADG键盘[注 2] ,也因此可以在短时间内以低成本训练听打人员。TBS与朝日电视台采用此种输入方式。
- 使用速记键盘输入
- 使用针对速记进行优化的键盘,如Speed文字处理机或Stentura。[5] 而此种输入方式最大的不同之处在于会将字幕输入人员分为输入听取到的字母,与将字母转换成汉字的人员两组。因此,这种方法至少需要两名人员。虽然在输入速度上较以往的方法快速,但需要高价的专用键盘,且需要花费大约三年的时间来培训听打员[6]。高速字幕处理研究所[7] 与 Word Warp[8]皆采用了此种方式,并且与NHK和几家商业电视台签订合约。[6][9]。
而由于此种字幕输入方式通常因打字速度较广播音讯慢,而通常将文字听打员分为多组,分别负责输入文字与校对字幕等。
经由使用透过语音辨识直接生成字幕。语音辨识于现今仍难以达到100%的正确率,但若是新闻等使用固定语调与单词的节目则较容易实现。在系统开发初期,通常即时字幕只适用于摄影棚内的播音员谈话时,而事先录制的影像等则通常不会附加字幕。而体育赛事与NHK红白歌合戦等节目也可以透过由播音员重复叙述的方式生成字幕[10]。
NHK自2012年3月14日开始于一部分的《NHK新闻》采用混合方式生成字幕,于播音员谈话等辨识率较高的部分采用语音辨识系统,输入字幕的人员只会负责输入辨识不清楚的部分。[11]。
AbemaTV自2018年12月10日开始,于播出的《榉山丘》开始使用由LASSIC开发的即时AI字幕系统“AI Pon”[12]。
备注
Wikiwand - on
Seamless Wikipedia browsing. On steroids.