Loading AI tools
国際規格 ISO 639 言語コードのひとつ ウィキペディアから
ISO 639-3:2007(アイエスオー639-3:2007)は、国際規格 ISO 639 言語コードのひとつであり、国際標準化機構によって2007年2月5日に公刊された[1]。
ISO 639-3 は ISO 639-2 3文字コードの拡張で、知られるすべての自然言語の網羅を目的とする[2]。言語の範囲の規定は主に国際SIL(登録主体[3])が出版するエスノローグの言語コードに基づき拡張された。このコード体系は、当該の言語が現存するか消滅したか、古代語か人工言語であるかを問わず、使用者の数は不問とし、書かれた記録があるかどうかに関わらず、可能なかぎり網羅的な言語の一覧を提供する[1]。ただし、インド・ヨーロッパ祖語のような再建された言語は含まない[4]。
ISO 639-3 はさまざまな応用に供することを目指す。計算機と情報システムではインターネットのように多言語を支援する必要に応じて広く使われる。また、言語学の文献その他において、言語名では不明瞭であったり多義的であったりする場合に、それを補うために用いる[5]。
ISO 639-3 は言語を包括的にカバーし、すべての言語に等しい機会を与え、情報技術で広く採用されているため、情報格差に対応する重要な技術である[要出典]。
このコードは、ISO 639-1 の定義を踏襲し、世界の文献でもっとも頻繁に使われるすべての言語を含んでいる。ISO 639-2 は言語だけでなく複数の言語グループにもコードを与えているが、ISO 639-3 は単言語を対象とするため、ISO 639-2 の上位集合ではない。また下記に示すとおり ISO 639-2 に設けたBコードとTコードの2種類に対し、ISO 639-3 はTコードのみ用いる。
例:
2012年4月の段階で、ISO 639-3 には 7776言語を登録している[8]。
ISO 639-3 には以下の言語を含む。639-2 の単独の言語、エスノローグ記載の現代語、Linguist Listに記述された歴史的な変種、古代語、人工言語[9]に加え、毎年のコメント期間中に推奨された言語。
登録主体は機械可読なデータファイルを提供する[8]。このデータファイルを使用すると、ISO 639-1 または ISO 639-2 から ISO 639-3 への変換ができる。
ISO 639-3 は原則として、主観的でない基準に従って言語の区別を行う[10]。方言その他の言語未満の変種について識別子を与えることは目的ではない[11]。しかし言語の区別には主観がはいりこみ得る。とくに口頭言語の変種の場合はその傾向が顕著で、文字で記したり教育やメディアで使ったりすることで、様式化が進まないまま存在する[要出典]。
ISO 639-3 のコードはアルファベット3文字であるため、格納できる言語の最大値は 26 × 26 × 26=17576 件である。そのうち ISO 639-2 指定範囲(特殊コード4件・予備コード520件・Bのみのコード23件)の合計547は、ISO 639-3 コードから除外され、実質の格納は17030 が最大値となる(17576 - 547)。
ISO 639-2 の言語グループ名のうち ISO 639-5 に定義のないものを除くと、さらにその数は少なくなる[要出典]。
ISO 639-3 では ISO 639-2 のうち標準の目的において56言語を「マクロランゲージ」ととらえる[12][疑問点]。ISO 639-2 で個別言語として扱わない複数の言語(例:ara
アラビア語)は、ISO 639-3 で新たに定義された。他のマクロランゲージのうち nor
(ノルウェー語)は、すでに ISO 639-2 に2つの個別言語がある(nno
ニーノシュク および nob
ブークモール)。
このことは、ISO 639-2 と ISO 639-3 では、前者が特定の言語の方言と見なした言語を、後者は個別言語と見なさす違いを意味する[13]。例としてISO 639-3 はアラビア語(ara
)に対する標準アラビア語(arb
)を方言としない。
マクロランゲージは、言語学的には異なる言語であっても、話者は同じ言語の2つの変種として扱う場合を反映する試みである[13](例:ダイグロシア。)
集合的言語コード要素とは、いかなる文脈においても単一の言語と考えられない、個別言語のグループを表す識別子である[14] 。これらのコードは個別言語でもマクロランゲージでもない。
ISO 639-2 には集合的言語のための3文字識別子が含まれるが、ISO 639-3 からは除外されている。したがって、この点でも ISO 639-3 は ISO 639-2 の上位集合ではない。
ISO 639-5 は語族や語派のための集合的コードを定義している。
特定のコードのいずれも妥当でない場合のために、4つのコードが定義されている。これらのコードは、主にデータベースのように、ISO コードが存在しなくても指定しなければならない場合に使用することを目的とする。
コード | 意味 |
---|---|
mis | その他の言語 |
mul | 複数言語 |
und | 不明言語 |
zxx | 言語ではない |
mis
[15]は、ISO標準に(まだ)含まれていない言語のために用いる。
mul
は、データが複数の言語からなるが、データベースが単一のISOコードを指定することを要求しているときに用いる。
und
は、データに使用されている言語名が不明である(誤ってラベルづけされている、ラベルづけされていないなど)場合に用いる。トロイ語のように、言語名は存在するが言語そのものが不明である場合に使用することは目的としていない。
zxx
は、データが言語でない場合(動物の鳴き声など)に用いる[16]。
以上に加えて、qaa
から qtz
までの範囲はローカルに使用する場合のために予約されている。たとえばLinguist List で消滅した言語のために用いる。Linguist List ではこのうちひとつに汎用の値を割りあてている。
コード | 意味 |
---|---|
qnp | 名前のない祖語 |
このコードは、言語系統図において名前のない節点を表すのに使われる。
ISO 639-3 のコード表は変更可能であるが、すでに使われているコードを守るため、変更が許されるのは以下の場合に限られる:[17]
変更は年1回行われる。各変更要求は最低3か月の公開レビュー期間が与えられる。
ISO 639-3 のサイトの「命名の範囲」[18] およびSILの言語の型[19]において、コードを与える範囲と、どのような条件を満たさなければならないかを説明している。たとえば、人工言語に識別子を与えることはできるが、それが人間のコミュニケーションのために設計されており、かつ文献がある場合に限られる。この制約は個々人の発明に対する要求がなされることを防ぐためにある。
登録主体のWebサイトでは、ISO 639-3 のコード表がどのように保守されるかついて説明している[20]。同時に、変更要求を受けとり処理するためのプロセスも記述している[21]。
このWebサイトでは変更要求の書式と、追加提案に関する情報を収集するための第二の書式が提供されている。任意の団体が変更要求を提出できる。提出された要求はまず登録主体によって不備がないかレビューされる。
不備のない文書による要求を受けとった場合、その要求が公開されている「変更要求インデックス[22]」に加えられる。同時に「Lingust List」の「LINGUIST」ディスカッション・リストおよび関連すると登録主体がみなしている他のリストに告知がなされ、変更要求に対する公開レビューに招待する。どのリストのオーナーおよび個人も特定の地域や語族に関する変更要求に関する通知を受け取ることができる。受け取ったコメントは他の団体がレビューするために公開される。コメントの総意にもとづいて、変更要求は撤回されるか、または「候補状態[23]」に昇格する。
毎年のレビュー期間が終了する3か月前に、LINGUIST のディスカッション・リストおよび他のリストに、「候補状態の変更要求[24]」に関する告知がなされる。すべての要求は、レビュー期間が終了するまでレビュー・コメントが可能である。
毎年のレビュー期間の終了時に決定がなされる。要求は全体あるいは一部が採用されるか、修正されて翌年に持ちこされるか、または検討が撤回される。各変更要求と、それに対する決定・決定の根拠の公開アーカイブが保守されている[25]。
言語学者のモーリー、ポストおよびフリードマンは ISO 639-3 に対してさまざまな批判を提起している[26]。
jnj
が割りあてられているが、これは差別語の「Janejero」に由来する。これらのコードはその言語の話者を侮辱するものであるが、標準において割り当てを変更することができない。マーティン・ハスペルマートはこの指摘のうちの4つを認めたが、言語変化については認めなかった[27]。ハスペルマートによれば、どのような言語の記述もそれが何の言語であるかを同定することが必要であるし、言語の異なる段階を区別するのは容易であるから、言語変化に関する指摘は不当なものである。ハスペルマートは、言語学者は languoid レベルのコード化を行うことを好むだろうとする。「言語学者にとって、それが言語であるか、方言であるか、緊密な関係にある複数の言語であるかが意味を持つことはほとんどない」ためである。ハスペルマートはまた、ISO が言語の同定を行うことが妥当かにも疑問を投げかける。ISO は工業規格の機関であるが、言語の文献と用語は科学的な努力であるとする。ハスペルマートは言語コードの本来の必要性は「翻訳とローカライズの経済的重要性」にあり、ISO 639-1 と ISO 639-2 はそのために作られたことを指摘する。しかし ISO 639-3 によって提供されるような「狭いコミュニティーで使われ、全くないしほとんど書かれることのない、しばしば絶滅の危機にある、ほとんど知られていない言語」を含む包括的なコードが工業的に必要かどうかは疑問とする。
以上のうち日本語は ISO 639-1 と ISO 639-2 の両方で、アイヌ語は ISO 639-2 でコード化されている。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.