Loading AI tools
ウィキペディアから
GSM-EFR 、GSM Enhanced Full Rate、あるいはGSM 06.60 は GSM デジタル携帯電話システムで用いられる音声符号化方式で、それまでに使われていた GSM-FR(GSM Full Rate)の音質を改善するために開発された。コーデックのビットレートは 12.2kbps で、有線の電話回線で使われる G.726 32 kbps ADPCM と同等の音質を実現している[1]。 また、3GPP が採用した音声符号化方式である AMR の 12.2kbps モードは GSM-EFR と互換性がある。
GSM-EFR は GSM-FR や GSM-HR に続いて採用された音声符号化方式で、現在の仕様は ETSI 06.60 (ETS 300 726) で定義されている。フィンランドの電気通信機器メーカーであるノキアとカナダのシャーブルック大学が開発を行い、1995年に GSM-EFR の方式として採用され[2]、その後最初の仕様書が1997年に発行された [3]。
それまでに GSM で使われていた GSM-FR や GSM-HR と比べ音質が向上しており、従来の符号化方式が通信エラーの無い条件でも有線の電話回線以下の音質なのに対し、GSM-EFR は典型的な通信エラーの条件や背景雑音のある環境でも有線の電話回線と同じ音質を維持できる[1]。
GSM-EFR では符号化アルゴリズムとして CELP の一種である ACELP を用い、符号化に必要な演算量はハーフレートコーデックの GSM-HR より低い[1]。
GSM-EFR の特徴は以下の通りである [4]。
GSM-EFR の符号化データを RTP を用いインターネット上で送るためのデータ形式は、IETF標準の RFC 3551 で定義されている [6]。 符号化データは 31バイト/20 ms に丸められるため、VoIPなどでのビットレートは 12.4kbps になる。
GSM-EFR では、他の多くの携帯電話向けの音声符号化方式と同様、 ACELP アルゴリズムを用いる。 この方法は、人間の音声を声道に相当する線形予測フィルターと声帯に相当する適応型と固定型のコードブックとでモデル化する CELP をベースとし、代数的に決められた位置に配置した振幅が+1/-1のパルスの組み合わせを固定型コードブックとして使用する。
この方式は GSM-HR(ハーフレートコーデック)で使われている VSELP などのアルゴリズムと比べ演算量とメモリ使用量が少なくて済む特徴がある。
GSM-EFR 符号化の際の全体の処理はおおよそ以下のようになる[4]。
処理は 20 ms 長(160サンプル)のフレームを 5 ms 長(40サンプル)のサブフレームに分割して行う。 入出力のサンプリング周波数は 8 kHz で、13 ビット幅のリニアPCM、あるいはそれに相当する 8 ビット A-law/μ-law PCM である。
40 サンプルからなるサブフレームを以下の 5 トラックに分け、それぞれに対して 2 ビット(全体で 10 ビット)の+1/-1パルスを割り当てる。
トラック | 値 | パルス | パルス位置 |
---|---|---|---|
1 | ±1 | i0, i5 | 0, 5, 10, 15, 20, 25, 30, 35 |
2 | ±1 | i1, i6 | 1, 6, 11, 16, 21, 26, 31, 36 |
3 | ±1 | i2, i7 | 2, 7, 12, 17, 22, 27, 32, 37 |
4 | ±1 | i3, i8 | 3, 8, 13, 18, 23, 28, 33, 38 |
5 | ±1 | i4, i9 | 4, 9, 14, 19, 24, 29, 34, 39 |
復号は符号化と逆の処理を行う。
符号化に必要なビットの構成は以下の通りで、ビットレートは 12.2 kbps になる。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.