Loading AI tools
倍音を加算して音色を作成する手法 ウィキペディアから
音響信号処理における加算合成(かさんごうせい、英: additive synthesis)は複数の純音を重ね合わせ(加算して)音響信号を合成する、音声合成の一種である[1][2]。アディティブ・シンセシスとも呼ばれる。対比される合成手法に減算合成がある。
音響信号は正弦波の重ね合わせで表現できる。またヒトの聴覚には可聴域が存在するため聞こえる周波数に上限がある。このことは周期信号と聴覚上等価な合成音を正弦波の有限和で表現できることを示唆する(詳細: #理論的背景)。
加算合成は有限個の正弦波を加算して音を合成する手法の総称である。正弦波の周波数・振幅・位相を適切に設定することで多様な音を生成・再現できる。
実装としては事前計算した波形テーブル(ウェーブテーブル・シンセシス)や逆高速フーリエ変換を活用できる。
合成要素となる個々の正弦波は部分音(パーシャル)と呼ばれる。特に倍音はハーモニック・パーシャル(調波)、非倍音はインハーモニック・パーシャル(非調波)と呼ばれる。
音響信号は正弦波の重ね合わせで表現できる(フーリエ変換)。さらに信号が周期性を持っていれば、その信号は正弦波の無限和で(積分せずに)表現できる(フーリエ級数)。
また、ヒトには知覚可能な周波数範囲(可聴域)が存在する。標準的には15kHzが上限でありそれ以上の音を聞き取ることができない。これは信号から可聴域外の成分を取り除いても聴覚上の差がない(=等価である)ことを意味する。
この2つの事実は、ある周期的な音響信号と聴覚上等価な信号を正弦波の有限和で表現できることを示唆する。なぜなら正弦波の無限和に含まれる15kHz以上の正弦波成分を除いても聴覚上等価な信号が構成でき、それは有限個の正弦波の和を意味するからである。
加算合成は有限個の正弦波を加算して音を合成する手法の総称である。パラメータの時変性や周波数制約に基づき、様々なタイプの加算合成が存在する。
以下、各部分音のインデックスを 、初期位相を 、部分音の総数を 、合成音を とする。各部分音において周波数を 、振幅を とし、これが時変の場合は瞬時周波数 、瞬時振幅 を用いる。
次の表は様々な制約をもった加算合成を表現する式の一覧である。各手法は以降の節で詳説されている。
単純な加算合成では単一合成区間内で周波数と振幅を固定する(時不変)。この方式は次のように定義される[3]:
振幅を時間に応じて変化させる場合(c.f. 振幅変調)、次のように定義される:
帯域制限(band-limited signal)の観点から、 の変化は振幅変調による帯域の広がり が 隣接部分音間の周波数間隔より有意に小さくなるよう[4][5][注釈 1]、充分ゆっくりした速度で変化させる必要がある[1][注釈 2]。すなわち次の制約を留意する必要がある。
周波数を時間に応じて変化させる場合(c.f. 周波数変調)、次のように定義される[注釈 3]:
最も一般化された加算合成は次のように定義される:
自然界に存在する多くの音は調波構造を有している。すなわち基本周波数 成分(基音)とその整数倍成分(倍音)を多分に含んでいる。このことに注目し、部分音として基音および倍音のみを加算して音を合成する手法を調波加算合成(ハーモニック・アディティブ・シンセシス)という。
時不変振幅・周波数を用いた調波加算合成は次のように定義される:
周波数が で定義されるため、部分音#k はk次倍音(k=1なら基音)に相当する。
「アディティブ・シンセシス」という用語は広義に、正弦波ベースか否かを問わず「単純な基本要素を足し合わせて複雑な音色を合成する」タイプのサウンド・シンセシス手法全般を指す包括的用語として使われる事がある。[6][7] 例えば F. Richard Mooreはサウンド・シンセシスの「四つの基本カテゴリー」として、アディティブ・シンセシスを他の三つと共に挙げている。[7]
この広義の意味で、正弦波以外の音色(パイプやストップ)を組み合わせるパイプオルガンや電子オルガンも広義のアディティブ・シンセサイザーと見なせる。また主成分(変量間の相関行列の固有値分解で得られる合成基底)やウォルシュ関数(Walsh-Hadamard変換の基底関数)の総和による音響合成も、広義のアディティブ・シンセシスに分類できる。[8]
音声信号の分析により周波数・振幅・位相が得られれば、これを加算合成に用いて音声を再構築できる。分析と合成を一体で捉えた音声処理を音声分析合成という。合成部に加算合成を用いる場合、分析部に用いられる手法の例として帯域通過フィルタバンク、短時間フーリエ変換(McAulay-Quatieriアナリシス[9][10])、経験的モード分解[11]が挙げられる。
合成部に加算合成を用いる具体的な手法としては以下が一例に挙げられる。
またソフトウェア実装には下記がある:
言語学の研究では1950年代初頭より、合成あるいは変更した音声スペクトログラムの再生にハーモニック・アディティブ・シンセシスが使用されている。[20] 1980年代初頭には、音声の音響的手がかり(acoustic cues)の意義を評価するために、それらを取り去った合成音声の聴取テストが行われた。[21] また線形予測符号で抽出したフォルマント周波数と振幅の時系列を使う音声合成手法の一つ sinewave synthesis は、インハーモニックな正弦波パーシャルの加算合成を行う。[22](関連:Sinusoidal Modeling)
今日のアディティブ・シンセシス実装系は、主にデジタル処理で実装されている(#離散表現参照)。
アディティブ・シンセシスは、各パーシャルに対応して正弦波オシレータを複数用意したオシレータ・バンクで実装できる[1](記事冒頭の図参照)。
楽音がハーモニックで準周期的な場合、ウェーブテーブル・シンセシスは時間発展のあるアディティブ・シンセシスと同様な一般性を備え、しかも合成に必要な計算量は少なくて済む。[23] 従って、ハーモニックな音色合成のための時間発展のあるアディティブ・シンセシスは、ウェーブテーブル・シンセシスで効率的に実装できる。
グループ・アディティブ・シンセシス(Group additive synthesis)[24][25][26] は、各パーシャルを基本周波数の異なるハーモニック・グループに分け、各グループ個別にウェーブテーブル・シンセシスで合成後、ミックスして結果を得る手法である。
逆高速フーリエ変換は、変換周期を均等分割した周波数[注釈 4] に関する(加算)合成を効率的に行える。また、離散フーリエ変換の周波数領域表現を注意深く考慮すれば、複数の逆高速フーリエ変換結果をオーバーラップさせた列を使って、任意周波数の正弦波による(加算)合成を効率的に行える。[27]
訳注: この章は、アディティブ・シンセシスとその関連概念の歴史的背景を扱っていますが、一部記述は背景説明の不足により主旨が判りにくい可能性があります。 |
調和解析は、1822年フランスの数学者ジョゼフ・フーリエ[28]が熱伝導の文脈で彼の研究に関する広範な論文を発表して、研究が端緒に付いた。[29] この理論の初期の応用には、潮の干満の予測がある。1876年頃、[30] ケルビン卿ことウィリアム・トムソンは機械式の潮汐予測機(Tide-predicting machine)を構築した。この装置はharmonic analyzerとharmonic synthesizerで構成され、それらは19世紀に既に前述の名で呼ばれていた。[31][32] 潮汐の測定値は、ケルビン卿の兄ジェームズ・トムソンの積分機(integrating machine)を使い分析された。結果として得られたフーリエ係数は、紐と滑車のシステムを使ったsynthesizerに入力され、将来の潮汐の予測のための正弦波基底の調和部分波が生成され足し合わされた。同様な装置は1910年にも、音の周期波形の解析を目的として構築された。[33] この装置のsynthesizer部は合成波形をグラフに描画し、それは主に解析結果の視覚的検証に使用された。[33]
フーリエ理論の音への応用は、1843年ゲオルク・オームによって行われた。この系統の研究はヘルマン・フォン・ヘルムホルツにより大きな進歩を遂げ、彼は8年間の成果を1863年出版した。[34] 彼は、音色の心理的知覚は学習によるものだが、官能的感覚は純粋に生理的なものだと信じていた。[35] また彼は、音の知覚は基底膜の神経細胞からの信号に由来し、これら細胞の弾性付属物は適切な周波数の純粋な正弦波トーンに共鳴振動する、という考えを支持した。[33] この他ヘルムホルツは、ある種の音源はインハーモニック(基底周波数の非整数倍)な振動モードを含むとする エルンスト・クラドニの1787年の発見に同意した。[35]
ヘルムホルツの時代、電子的な音響増幅手段(アンプ)はまだ存在しなかった。ヘルムホルツは、ハーモニック・パーシャルに基づく音色合成(ハーモニック・アディティブ・シンセシス)を目的として、パーシャル生成用の電磁石励起式の音叉と、音量調整用のアコースティックな共鳴チャンバー (ヘルムホルツ・レゾネータ) の組を並べた装置を製作した。[36] 製作は少なくとも1862年という早い時期に行われ、[36] 次にルドルフ・ケーニッヒにより洗練され、1872年ケーニッヒの装置の実演が行われた。[36] ハーモニック・アディティブ・シンセシスに関し、ケーニッヒは彼の音波サイレン(wave siren)に基づく大型装置も製作した。この装置は空気圧式で、切断したトーンホイールを使っていたが、パーシャルの正弦波精度が低い点を批評された。[30] なお19世紀末に登場したシアター・オルガンのTibiaパイプは正弦波に近い音波を発生でき、アディティブ・シンセシスと同様な方法で組み合わせる事ができる。[30]
1938年ポピュラーサイエンス誌で、人間の声帯は消防サイレンのように機能して、倍音に富んだ音色を生成し、その音色は声道でフィルタリングされ、異なる母音の音色が生成される、とする説が新しい重要な証拠と共に[37]報じられた。[38](関連:ソース・フィルタモデル)既に当時、アディティブ方式のハモンドオルガン(トーンホイールによる電気機械式実装)が市販されていた。しかし初期の電子オルガン・メーカの大多数は、大量のオシレータを要するアディティブ方式オルガンの製造は高価過ぎると判断し、代わりにサブトラクティブ方式オルガンの製造を開始した。[39] 1940年無線学会(IRE)の会議でハモンドのフィールド・エンジニア長は、従来の「音波を組合せて最終的な音色を組み上げる」[注釈 5]ハモンドオルガンとは対照的な、「サブトラクティブ・システム」を採用した同社の新製品ノヴァコードについて詳しい説明を行った。[40]
Alan Douglasは1948年のRoyal Musical Associationの論文で、異なる方式の電子オルガンを説明するために修飾子「アディティブ」と「サブトラクティブ」を使った。[41] 現代的な用法のアディティブ・シンセシス、サブトラクティブ・シンセシスという用語は、彼の1957年著作“The electrical production of music”に登場しており、音色生成の3つの手法が次の3つの章に示されている:[42]
現代のアディティブ・シンセサイザーは典型的に、出力を電気的アナログ信号やデジタルオーディオの形で生成する。後者の例には2000年前後に一般化したソフトウェア・シンセサイザーが含まれる。[43]
以下に、歴史的もしくは技術的に注目に値するアディティブ・シンセシスの実装例(電気/アナログ/デジタル式のシンセサイザーやデバイス)を年表形式で示す。
初期実装 | 商用化 | 組織 | 名称 | 概要 | サンプル |
---|---|---|---|---|---|
1900[44] | 1906[44] | New England Electric Music Company | Telharmonium | ポリフォニックかつタッチセンシティブな、最初のサウンド・シンセサイザー[45] 実装: 正弦波加算合成。トーンホイールとオルタネーターを使用。 発明者:Thaddeus Cahill |
no known recordings[44] |
1933[46] | 1935[46] | Hammond Organ Company | ハモンドオルガン | Telharmoniumと同様な方式で大きな商業的成功を収めた、電気楽器式アディティブ・シンセサイザー[45] 実装:正弦波加算合成。トーンホイールとマグネティック・ピックアップを使用。 発明者:Laurens Hammond |
|
1950 or earlier [20] | Haskins Laboratories | Pattern Playback | スピーチ・シンセサイザー
実装:ハーモニック・パーシャル(整数次倍音)の振幅を、手描きまたは分析で得たスペクトログラムで制御。各パーシャル(部分音)は、マルチトラックの光学式トーンホイールで生成。[20] |
samples | |
1958[47] | ANS | 微分音(マイクロトーナル)を扱う光学-電子式アディティブ・シンセサイザー[48]
実装:マルチトラックの光学式トーンホイールで、マイクロトーナル・パーシャル列(微分音列)を帯状の光源として生成。黒い樹脂を塗布したガラス表面を引掻いて作成したマイクロトーナル・スコア(スペクトログラム類似)を、時間軸方向に光電管でスキャンして音を合成。 |
|||
1963[51] | MIT | 楽器音色をアタック[要曖昧さ回避]部と定常部に分け、デジタルで スペクトル分析/再合成 を行うオフライン処理システム
発明者:David Luce[51] |
|||
1964[52] | イリノイ大学 | Harmonic Tone Generator | 電圧制御式電子回路によるハーモニック・アディティブ・シンセシスのシステム | samples (info) | |
1974 or earlier [54][55] | 1974 [54][55] | RMI | Harmonic Synthesizer | デジタル・オシレータを使いアディティブ・シンセシス[56]を実装した最初のシンセサイザー製品、[54][55] 時間変化するアナログ・フィルタも備えている[54]
関連: RMIの親会社Allen Organ Companyは1971年、North American Rockwellが開発したデジタル・オルガン技術に基づき、世界最初の教会用デジタル・オルガン製品 Allen Computer Organを発売した。[57] |
1 2 3 4 |
1974[58] | EMS (London) | Digital Oscillator Bank | ミニコン制御でデジタル式の 分析/再合成楽器(チャンネル・ヴォコーダ類似)
実装:複数のデジタル・オシレータの組(バンク)。任意波形を利用可能、周波数と振幅を個々に制御可能。[59] EMS製作のデジタル式Analysis Filter Bank (AFB)と組み合わせ、分析/再合成に使用。[58][59] |
in The New Sound of Music[60] | |
1976[61] | 1976[62] | Fairlight | Qasar M8 | 完全デジタル処理のシンセサイザー、高速フーリエ変換を使用[63]
実装: 各ハーモニクスの振幅エンベロープを、画面にライトペンで描き、高速フーリエ変換でサンプリング・データを生成[64] |
samples |
1977[65] | (1980) [66] | ベル研究所 | Digital Synthesizer | リアルタイム計算によるデジタル・アディティブ・シンセサイザー、[65] 「最初の真のデジタル・シンセサイザー」と呼ばれている[67]
別名:Alles Machine, Alice. |
sample (info) |
1979[67] | 1979[67] | New England Digital | Synclavier II | デジタル・シンセサイザー製品
実装:アディティブ・シンセシスで生成した複数の波形を、クロスフェードでスムースに切り替えて音色の時間発展を実現。 |
(File:Jon_Appleton_-_Sashasonjon.oga) |
訳注: 2012年11月17日12:15(GMT)現在の英語版記事のこの章にはいくつか問題があります:
|
アディティブ・シンセシスのデジタル実装では、これまで扱ってきた連続時間の式(連続時間形式)の代わりに、離散時間の式(離散時間形式)を用いる。
連続時間形式(3)を出発点とする:
連続時間形式を書き換えて離散時間形式を得るために、下記の置換を使う:
すると次の離散時間形式が得られる:
ここで の差分より
である。[27]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.