Loading AI tools
日本语音合成软件 来自维基百科,自由的百科全书
VOCALOID(日语:ボーカロイド,简称ボカロ,Vocaloid,博歌乐),是日本乐器制造商山叶公司开发的电子音乐制作语音合成软件[2],输入音调和歌词,就可以合成为原为人类声音的歌声。2003年2月推出首个版本,2007年1月推出新版本VOCALOID 2。2008年4月4日,发表开发线上版“NetVOCALOID”[3][4],9月30日于“CEATEC JAPAN 2008”正式展示,可于网页浏览器直接使用,相比非网上版,因为是由伺服器计算合成声音,客户端的电脑负荷可大大减低[5]。2009年4月9日正式公开,服务提供于部分手提电话[6][7]。VOCALOID 3于2011年10月21日正式发售。时隔3年后VOCALOID 4于2014年11月20日正式公布,于2014年12月31日发售。2018年7月12日,VOCALOID 5正式公布[8]。2022年,VOCALOID 6发布,导入了AI引擎[9]。
开发者原来想将Vocaloid命名为“雏菊”(英语:Daisy)并参考了歌曲Daisy Bell,但由于版权问题,最终该软件被命名为Vocaloid[10]。Vocaloid一词的来源有2种说法:
Yamaha于2000年3月开始研发VOCALOID并宣布将于2003年3月5日至9日在德国的法兰克福国际乐器展览会公示其存在[11]。2005年6月,Yamaha对VOCALOID更新至V1.1;此后进一步对其改进,版本更新至V1.1.2[12]。使用第一代VOCALOID的虚拟歌姬共有5个。最初的系统只有装满处理算法的处理引擎,并无音色[2]。 VOCALOID 2于2007年发布。与第一代引擎不同,VOCALOID 2基于其对声音样本的探测结果而非人声的分析[13]。合成引擎和用户界面被彻底改造,日本的VOCALOIDs拥有自己独有的日本界面VOCALOID 2系统的主要部分是乐谱编辑器(VOCALOID 2编辑器)[14],歌手库和合成引擎。合成引擎从乐谱编辑器接收乐谱信息、从歌手库中选择适当的音色,并将它们融合在一起以输出合成音[15]。Yamaha提供的乐谱编辑器和合成引擎在不同的VOCALOID 2产品中基本没有区别。
VOCALOID 3于2011年10月21日推出,一些工作室可以将VOCALOID 2的声乐库搬至VOCALOID 3[16]。
2014年10月,首个使用VOCALOID 4的产品被确定为英语音源Ruby。此前发布被延迟,而这恰好让其可以用到全新的发声引擎VOCALOID 4。不久以后,克林普顿未来媒体对即将面世的“新Luka声乐”作出了报道。2015年,数个V4版的人声发布,此后不久VOCALOID 4发布[17]。2018年,VOCALOID 5发布。2022年10月,引入了AI引擎的VOCALOID 6发布[18]。
软件采用Yamaha开发的“Frequency-domain Singing Articulation Splicing and Shaping”[19]。先对人声进行取样,再制作成歌声资料库。但VOCALOID没有歌声资料库,实际可使用的版本由其他公司开发[20]。
克理普敦未来媒体的初音未来Vocaloid 2软件发布后[21],VOCALOID开始在日本流行起来,她的成功让Vocaloid软件渐渐普及[22],是VOCALOID成名的关键因素。初音未来的代表作是Ievan Polkka[2](又称甩葱歌)。日本视频分享网站Niconico在软件的认可和普及中发挥了重要作用。克里普敦未来媒体称,他们知道在初音未来发布前,Niconico的用户便已开始以视频的形式发布用VOCALOID制作的歌曲,这些视频充分展现出了该引擎制作多媒体文件时可以展现出的各种可能,尤其是同人文化[23]。随着其认可度和知名度的不断上升,Niconico成为了合作内容创建的地方,用户在这里将编写的原创流行歌曲与2D动画和3D动画以及其他用户的混音混合起来,许多创作者也可以在此展示一些未完成的作品并征求意见[24]。该软件也被用于以歌曲和诗歌的形式讲故事,例如现已有1部漫画、6本书和2本剧本的作品恶之系列[25][26]。NICONICO动画在推广Vocaloids方面发挥的重要作用也激起了人们对软件的兴趣,三浦建太郎也因为对网站的热爱而为他提供了免费服务[27]。VOCALOID影响巨大,在线音乐分享平台SoundCloud和视频网站Youtube上相关音乐和视频的数量已达到了240万[2]。
2009年9月,3个与初音未来密切相关的雕像被载上了美国内华达州黑岩石沙漠的火箭,但它没能抵达外层空间[28][29]。2010年5月21日06:58:22(日本标准时间),日本首个金星探测器破晓号(日语:あかつき)在H-IIA运载火箭的帮助下从日本的种子岛宇宙中心发射,探测器内载有3个描绘初音未来的金属板[30][31]。为了提高捐血率,日本红十字会制作了初音未来的周边赠品[32]。
VOCALOID对中国大陆也产生了影响。在中国大陆,使用该软件的虚拟歌姬以洛天依最为出名,她由上海禾念信息科技有限公司和Bplats一同开发,于2012年7月发售,并曾于2016年在中国视频弹幕网站Bilibili举办的线下活动Bilibili Macro Link上亮相,代表歌曲为《千年食谱颂》等曲。2013年,第二位使用中文的虚拟歌姬言和横空出世,代表作为梦之雨等。
另外在台湾,则有华创文化有限公司代理销售的华语虚拟歌姬心华。于2015年4月24日在日本首卖[33];2015年6月27日在中国大陆首卖。
只输入音调和歌词的话,输出的声音的机械性通常会十分明显,要令声音显得自然,需要调整各种不同的参数:
名称 | 全称 | 特点 |
---|---|---|
VEL | Velocity | 音速参数。影响辅音长度。数值越低,辅音长度越长。在VOCALOID中,元音的起始时间是固定的,辅音占用前一音符的时值,因此该参数对以元音起始的音符无影响。 |
DYN | Dynamics | 动态度。影响音量。数值越高,音量越大。 |
BRE | Breathness | 气息度。数值越高,声音的气息感越强。 |
BRI | Brightness | 宏亮度。影响高频率的成分。数值越高,声音越宏亮。 |
CLE | Clearness | 清澈度。与宏亮感相似,但改变声质的原理不同。数值越高,声音越清澈。数值过高可能会造成声音质量的下降。 |
OPE | Openess | 开口度。以改变音色来模拟嘴巴的开合。数值越低,元音越模糊。降低其数值并配合力度参数可对爆音进行有效修补。 |
GEN | Gender Factor | 性别参数。影响声音结构。数值越高,越有男性的感觉;越低,则变成女性甚至幼儿的声音。如大量提升或降低数值,可与原本的声音完全不同。 |
POR | Portamento Timing | 滑音时间。调整滑音时的各音高的间隔。 |
XSY | Cross-Synthesis | 音色交叉度。数值越高,音色越偏向参数窗格左上角显示声库对应的音色;数值越低,音色越偏向参数窗格左下角显示声库对应的音色。本参数通常情况下只适用于同一名字下不同音色的声库(如GACKPOID V3下的各声库,包括Gackpoid_Native、Gackpoid_Power、Gackpoid_Whisper),但使用插件可以解除限制以混合任意歌手。可用于VOCALOID3与VOCALOID4声库(已于VOCALOID5中移除)。 |
GWL | Growl | 嘶吼度。(不可用于VOCALOID3及以下版本的声库。) |
PIT | Pitch Bend | 滑音杆。可控制滑音的旋律音程上滑音或下滑音。 |
PBS | Pitch Bend Sentitivity | 滑音杆灵敏度。控制滑音杆的变化,越高变化越大,1个参数等于1个半音。 |
HAR | Harmonic | 泛音。控制歌声里的泛音,越高声音便会更丰厚洪亮。该参数只存在于第一版的VOCALOID编辑器。 |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.