ISO 639 - Wikiwand

Die ISO 639 ist eine internationale Norm der Internationalen Organisation für Normung (ISO), die Kennungen für Namen von Sprachen (Sprachkürzel, Sprachcodes, Sprachencodes, englisch language codes) definiert.

Anwendung

Die in der Norm definierten Kennungen werden unter anderem in der Lexikographie, Linguistik, in Bibliotheken, Informationsdiensten und im Datenaustausch verwendet. Sie dienen zur eindeutigen Angabe von Sprachen und ihrer Kennzeichnung in Dokumenten. Sie wurden nicht als Abkürzungen eingeführt,^[1] da unter anderem eine Ähnlichkeit mit der bezeichneten Sprache nicht in jedem Fall gegeben ist.

Der Code ist in Kleinschreibung definiert. Damit wird eindeutig zwischen Sprachcode (Kleinschreibung) und den Ländercodes nach Standard ISO 3166 (Großschreibung) unterschieden.

Die Sprachcodes dieser Norm umfassen natürliche Sprachen und Plansprachen, aber keine Sprachen, die für die maschinelle Verarbeitung erstellt wurden, wie z. B. Programmiersprachen.

Teilnormen

Zusammenfassung

Kontext

Die Norm bestand bis November 2023 aus sechs Teilnormen: Fünf davon enthielten Kennungen mit zwei Buchstaben (ISO 639-1), drei Buchstaben (ISO 639-2, ISO 639-3 und ISO 639-5) und vier Buchstaben (ISO 639-6, 2014 zurückgezogen); ein Teil enthält Richtlinien für die Anwendung (ISO 639-4). Mit der Veröffentlichung der Edition ISO 639:2023 wurden die Code-Listen der Normenteile in sog. Sets überführt.

Die offiziell eingeführten Teilnormen waren:^[2]

ISO 639-1:2002 – Codes for the representation of names of languages – Part 1: Alpha-2 code
ISO 639-2:1998 – Codes for the representation of names of languages – Part 2: Alpha-3 code
ISO 639-3:2007 – Codes for the representation of names of languages – Part 3: Alpha-3 code for comprehensive coverage of languages
ISO 639-4:2010 – Codes for the representation of names of languages – Part 4: Implementation guidelines and general principles for language coding
ISO 639-5:2008 – Codes for the representation of names of languages – Part 5: Alpha-3 code for language families and groups
ISO 639-6:2009 – Codes for the representation of names of languages – Part 6: Alpha-4 representation for comprehensive coverage of language variation

Weitere Informationen 639-1, 639-2 ...

Schematische Übersicht der Teilnormen ISO-639
	ISO 639-1	ISO 639-2	ISO 639-3	ISO 639-5
Einträge	183	487	7921	115
Mögliche Kombinationen	676	17.576	17.576	17.576
Einzelsprachen	Einzelsprachen und Sprachgruppen mit starker gemeinsamer Zugehörigkeit		Einzelsprachen (auch Makrosprachen)
Kollektive Gruppen	^*)	Kollektive Gruppen für Sprachfamilien oder übrige Sprachen einer Familie		Kollektive Gruppen für Sprachfamilien

Schließen

^*)

ISO 639-1 schloss mit Bihari (bh) einen kollektiven Sprachcode für eine Sprachgruppe ein, bis er 2021-05-25 ungültig wurde.

ISO 639-1

Der Teil 1 der Norm wurde für den Einsatz in Terminologie, Lexikographie und Linguistik erstellt. Bis zu seiner offiziellen Verabschiedung 1988-04-01 wurde er unter dem Namen ISO 639 geführt. Vorläufer ist die ISO/R 639:1967 (siehe auch Requests for Comments (RFCs) RFC 1766 (März 1995)^[3] und RFC 3066 (Januar 2001).^[4] ) ISO 639-1 soll nicht nur die in der Literatur am meisten verbreiteten Sprachen abdecken, sondern auch die am weitesten „entwickelten“ Sprachen mit einem „spezialisierten“ Vokabular aufnehmen.^[1] Dabei werden nicht nur Einzelsprachen, sondern auch Sprachfamilien aufgenommen. Jede Sprache wird durch eine Kennung aus zwei Buchstaben repräsentiert (Alpha-2 Code). Zum Beispiel steht de für die deutsche Sprache oder fr für die französische Sprache. Insgesamt sind durch Nutzung der 26 lateinischen Buchstaben $26^{2}=676$ verschiedene Kennungen möglich, von denen 184 belegt sind (Stand: Dezember 2021^[5]). Verwaltet wird die Norm von dem durch die UNESCO gegründeten International Information Center for Terminology (Infoterm) in Wien.^[6]

Die Aufnahme weiterer Sprachcodes ist vorgesehen, jedoch nur für Kennungen, die gleichzeitig der Norm ISO 639-2 hinzugefügt werden. Für bereits bestehende Einträge der ISO 639-2 werden keine Zwei-Buchstaben-Kennungen mehr vergeben. Dies soll Kompatibilität gewährleisten.^[4]

ISO 639-2

Die spätere Norm vom November 1998 ISO 639-2 erweitert die ISO 639-1 durch eine größere Menge an Sprachen. Jeder in ISO 639-1 definierte Sprachcode findet sich mit einem Code aus drei Buchstaben auch in diesem Standard wieder (Alpha-3 Code).

Für die zweite Norm ISO 639-2 wurde die Kennung auf drei Buchstaben erweitert, so dass theoretisch $26^{3}=17\,576$ Sprachcodes möglich sind. Bislang sind 487 (Stand: Dezember 2024^[5]) Kennungen für Einzelsprachen und Sprachfamilien aufgenommen (inklusive der Sprachen nach ISO 639-1). Ziel der Norm ist der Einsatz in „Terminologie und Bibliographie“, um unter anderem den Bedürfnissen des Bibliothekswesens nachzukommen und eine möglichst weite Auszeichnung von Werken der Welt zu ermöglichen. Aufgenommen wurden Sprachen, für die eine als geeignet empfundene Menge an Literatur herausgegeben wurde. Da der Schwerpunkt auf der geschriebenen Sprache liegt, wurde auf eine Unterscheidung von Sprachen verzichtet, die in der geschriebenen Form zwar große Übereinstimmungen besitzen, doch in ihrer gesprochenen Form abweichen. So gibt es zum Beispiel keine Unterscheidung für die chinesischen Sprachen wie Hochchinesisch und Kantonesisch.^[1]

Die US-amerikanische Library of Congress übernimmt die Pflege dieser Teilnorm und veröffentlicht die aktuelle Codeliste.^[5]

Der Standard ISO 639-2 erweitert ISO 639-1 und führt alle dortigen Sprachcodes. Die Kennungen aus zwei Buchstaben werden in dieser Norm mit drei Buchstaben fortgesetzt, wobei weitestgehend für die jeweilige Kennung lediglich ein weiterer Buchstabe hinzugenommen und eine Ähnlichkeit damit gewährleistet wird (siehe unten für den Spezialfall der Kennungen ISO 639-2/B).^[7] Die Basis für die Sprachcodes dieser Norm war die MARC Code List for Languages,^[8] die seit 1968 verwendet und ebenfalls von der Library of Congress verwaltet wurde.

Unter den hinzugekommenen Kennungen sind historische Sprachen wie Mittelhochdeutsch (gmh für German, Middle High) oder Althochdeutsch (goh für German, Old High).

Kollektive Sprachcodes

Eine Besonderheit sind kollektive Sprachcodes (englisch collective language codes), die in der Norm ISO 639-1 nicht vorgesehen sind. Sie ermöglichen eine Kennzeichnung von Gruppen von Sprachen, für die eine Zuordnung von Kennungen zu den einzelnen Sprachen nicht vorgesehen ist. Dies kann für kleine Sprachen erfolgen, für die lediglich eine geringe Zahl an literarischen Werken vorhanden ist oder für die keine erhebliche Zunahme derer angenommen wird. Sie fassen einerseits Sprachfamilien zusammen wie die irokesischen Sprachen unter der Kennung iro oder bieten eine Sammelbezeichnung für alle übrigen Einzelsprachen einer Familie, bei der einzelne zugehörige Sprachen einen eigenen Eintrag besitzen. Dies ist der Fall bei der Familie der samischen Sprachen (Kennung smi für sonstige), bei der die zugehörige nordsamische Sprache bereits eine eigene Kennung besitzt (sme). In der Tabelle der Sprachcodes wird für erstere Gruppen in der Regel der Bezeichner languages (deutsch „Sprachen“), für letztere der Bezeichner (other) (deutsch „andere“) an den Namen angehängt, um kollektive Sprachcodes auszuzeichnen. Ist ein Sprachcode für eine einzelne Sprache verfügbar, soll dieser vorgezogen werden und keine Zuordnung eines kollektiven Codes erfolgen. Dies kann auch Sprachcodes betreffen, die neu in den Standard aufgenommen werden.

Eine Beschreibung für die Zuordnung von Einzelsprachen (ohne eigenen Eintrag) zu einer der durch ISO 639-2 angebotenen kollektiven Sprachcodes findet sich nicht in dem Standard. Die Library of Congress verweist allerdings auf die oben genannte Liste der MARC Code List for Languages, die diese Funktion erfüllen kann.

Terminologische und bibliographische Sprachcodes (T/B)

Ein weiterer Unterschied zu ISO 639-1 und auch den anderen Teilnormen ist die Verwendung terminologischer (englisch terminology code) und bibliographischer Kennungen (englisch bibliographic code), die mit ISO 639-2/T und ISO 639-2/B bezeichnet werden. Diese Unterscheidung wird für 22 Einträge gemacht^[9] und rührt weitestgehend daher, dass vor Einsatz der Norm bereits Konventionen im Bibliothekswesen für Drei-Buchstaben-Kennungen bestanden, die von der Benennung der bereits festgelegten Norm ISO 639-1 für zwei Buchstaben stark abwichen. Die deutsche Sprache gehört zu diesen Fällen, ihr B-Code ist ger, der T-Code deu.

Da in der Benennung eine Fortführung der ISO 639-1 angestrebt wurde, ist in den Fällen abweichender Bezeichner entschieden worden, zwei Codes einzuführen. Die terminologische Kennung führt also die Benennung nach ISO 639-1 weiter, während die bibliographische Kennung aus Kompatibilitätsgründen geführt wird und die vorherige, weitläufige Benennung reflektiert. Der Standard erlaubt die Mischung von T- und B-Codes nicht und mahnt eine Festlegung der verwendeten Art vor dem Datenaustausch durch die betroffenen Parteien an.

Änderungen

Ein Hinzufügen und Ändern von Sprachcodes sowie das Ändern ihrer Beschreibung ist möglich, dabei wird auf Stabilität im beschriebenen Standard geachtet. Sprachcodes nach ISO 639-2/B, die nur Kompatibilität gewährleisten sollen, sind von Änderungen jedoch ausgeschlossen. Ein nach Änderungen aufgegebener Code soll frühestens nach fünf Jahren wiederverwendet werden.

ISO 639-3

Die Norm ISO 639-3 wurde am 5. Februar 2007 herausgegeben^[10] und soll aufbauend auf den ersten beiden Teilnormen eine umfassende Abdeckung aller Sprachen der Welt ermöglichen. Die Kennungen aus drei Buchstaben aus der vorhergehenden Norm ISO 639-2 werden weitergeführt und somit kann auch ISO 639-3 theoretisch über 17.576 verschiedene Kennungen verfügen (praktisch unter anderem dadurch begrenzt, dass ISO 639-5 ebenfalls Alpha-3-Codes aufnimmt, die disjunkt (elementfremd) zu denen aus ISO 639-3 sind). Aufgenommen werden alle bekannten Sprachen, worunter auch alle lebendigen, ausgestorbenen, historischen sowie auch konstruierten Sprachen fallen. Mehr als 6.900 Sprachen sind bisher in den Standard aufgenommen worden. Gedacht ist die komplette Liste vor allem für den Einsatz in der Informationstechnik, wo eine komplette Auflistung aller Sprachen wünschenswert ist.^[11] Darunter sind auch Einträge wie für die schweizerdeutschen Dialekte (gsw, German SWiss),^[12] Kölsch (ksh) und die bairischen Dialekte (bar).

Verwaltet wird sie von der Organisation SIL International (Summer Institute of Linguistics), die mit dem Ethnologue bereits lebendige Sprachen (mit Ausnahmen^[13]) und Sprachcodes erfasst. In der 15. Ausgabe des Ethnologue wurden die bisherig von SIL vergebenen Codes – alle 3 Großbuchstaben – an jene von ISO 639-2 angepasst (724 Änderungen, und Kleinbuchstaben), um Konformität mit ISO 639-2/T zu ermöglichen. Weitere historische und künstliche Sprachen stammen von Linguist List.^[2]

Bis auf bibliographische Kennungen (ISO 639-2/B) finden sich alle Kennungen für Einzelsprachen der ISO 639-2 in dieser Norm wieder. Kollektive Sprachkennungen werden nicht geführt. Die Codes mit drei Buchstaben sind im ganzen Standard eindeutig gehalten, so dass die Bezeichner von bibliographischen und kollektiven Kennungen in ISO 639-3 nicht neu belegt werden können.^[11]

Makrosprachen

Eine Erweiterung ist der Gebrauch so genannter Makrosprachen ( = Gruppe von Einzelsprachen, obwohl ISO 639-3 eigentlich keine Gruppen möchte) (englisch macrolanguage, als Dachsprache, nicht zu verwechseln mit Makrofamilien). Dabei werden mehrere Einzelsprachen in einem Eintrag subsumiert, wie z. B. die chinesischen Sprachen im Eintrag zho, der unter anderem die Einzelsprachen Hochchinesisch, Hakka, Min Nan und Wu enthält. Formal werden die mehr als 50 Makrosprachen^[14] in den Normen ISO 639-1 (wenn erfasst) und -2 als Einzelsprachen geführt.

Im Gegensatz zu Sprachen, die über kollektive Sprachcodes repräsentiert werden, sollen Makrosprachen Einzelsprachen zusammenfassen, wenn unter bestimmten Gesichtspunkten die Betrachtung dieser Sprachen als eine einzelne notwendig erscheint. Dazu gibt die Registrierungsstelle Beispiele an:^[15]

es existiert eine einzelne hochentwickelte Sprache, die von Sprechern verwandter Sprachen verwendet wird, unter dem Eindruck einer gemeinsamen Identität (arabische Sprache),
es existiert eine gemeinsame geschriebene Form (chinesische Sprachen mit der chinesischen Schrift) oder
verschiedene Gruppen entwickeln sich getrennt, so dass eine eindeutige Kennzeichnung nötig ist, eine gemeinsame Identität aber noch existiert (kroatische Sprache, serbische Sprache, bosnische Sprache).

Makrosprachen können als Konzept die verschiedenen Ansätze der Teilnormen -2 und -3 zusammenbringen. Ein einzelner Eintrag aus ISO 639-2, der mehrere Einträge aus ISO 639-3 subsumiert, wird so in das Gefüge der dritten Teilnorm eingefügt.^[16] Jeder Makrosprachcode hat ein Äquivalent in ISO 639-2 mit Ausnahme der serbokroatischen Sprache (Stand: August 2007), die ursprünglich über einen nun obsoleten Eintrag in ISO 639-1 verfügte.

Einige Einzelsprachen, die in Makrosprachen zusammengefasst werden, besitzen auch eigene Einträge in den Normen ISO 639-1 oder -2. So fungiert die norwegische Sprache mit dem Code nor als Makrosprache, die beinhalteten Sprachen Bokmål (nb, nob) und Nynorsk (nn, nno) haben aber auch entsprechende Einträge in den anderen Normen.

Bei der Zusammenfassung in Makrosprachen kann es wie bei der malaiischen Sprache zu Namenskonflikten kommen. Während der Code zlm die Einzelsprache bezeichnet, steht msa für den Eintrag des Malaiischen als Makrosprache. Um Verwechslungen auszuschließen, erhalten die Benennungen dieser Einträge einen qualifizierenden Zusatz in der Auflistung der Kennungen.

ISO 639-4

Eine Erklärung zur Anwendung der Normen aus ISO 639 findet man in der Norm ISO 639-4. Diese Norm selbst definiert keine Sprachcodes.^[17] Die Veröffentlichung erfolgte im Juli 2010.^[18]

ISO 639-5

Eine Erweiterung der kollektiven Kennungen aus ISO 639-2 bietet ISO 639-5, die am 15. Mai 2008 herausgegeben wurde. Dabei wurden die bereits vorhandenen Kennungen aus ISO 639-2 aufgenommen. Dieser Normteil teilt keine Sprachcodes mit ISO 639-3, die Mengen der geführten Kennungen schließen sich gegenseitig aus.^[17]

Diese Teilnorm bietet eine Hierarchie von Sprachfamilien und erlaubt eine Strukturierung der Codes aus den Teilnormen 1–3. Dies ermöglicht eine unterschiedliche Abstufung in der Generalisierung zur Auszeichnung von Sprachdaten.

ISO 639-6

Die am 17. November 2009 veröffentlichte Norm ISO 639-6 definierte vierbuchstabige Codes (alpha-4) und bot eine Erweiterung der Sprachcodes aus den Teilen 1–3. Sie wurde am 25. November 2014 wieder zurückgezogen.^[19]

Integration und Beziehungen der einzelnen Normen

Die in den verschiedenen Teilnormen definierten Sprachcodes spielen zusammen und erlauben eine Auszeichnung mit unterschiedlicher Granularität. Diese Integration wird erst mit Veröffentlichung der Normen ISO 639-4 und ISO 639-6 abgeschlossen sein.

Die Normen der Reihe ISO 639 stehen in unterschiedlicher Beziehung zueinander. ISO 639-3 definiert die Menge aller Einzelsprachen (ergänzt durch die Makrocodes), während Teil 5 eine Hierarchie aus Sprachfamilien definiert. Diese klar abgegrenzten Mengen finden sich zum Teil in den beiden älteren Teilnormen -1 und -2 und deren Elemente werden dort unstrukturiert nebeneinander gestellt. ISO 639-1 stellt eine Teilmenge von Teil 2 dar, da dort stärkere Kriterien für eine Aufnahme als zwei-buchstabige Codes existieren.

Verwaltung

Die Verwaltung der Kennungslisten übernehmen ausgewählte Registrierungsstellen (Registration Authorities), deren Aufgabe in der Annahme und Prüfung der Anfragen zur Aufnahme neuer Kennungen sowie Änderungen bestehender Einträge ist.^[21] Die Registrierungsstelle für ISO 693-1 ist Infoterm, für ISO 639-2 die Library of Congress und ISO 639-3 wird von SIL International verwaltet.

Die Benennung der Kennungen soll möglichst der landessprachlichen Bezeichnung der kodierten Sprache folgen. Ausnahmen werden unter Umständen gemacht, wenn Länder, in denen die betroffene Sprache gesprochen wird, eine andere Benennung wünschen.

Spezielle Kennungen

Die beiden Normen ISO 639-2 und ISO 639-3 verfügen über spezielle Kennungen, um einen flexiblen Umgang mit der Identifizierung von Texten zu ermöglichen, darunter mis (von englisch missing code für „fehlender Code“) für Sprachen, denen noch kein Code zugeordnet wurde.

Die Kennungen von qaa bis qtz (inklusive der alphabetisch dazwischen liegenden Kennungen) sind für die lokale Verwendung registriert und werden von der Registrierungsstelle nicht vergeben.

Für eine Kennzeichnung für Dokumente ohne sprachlichen Inhalt wurde die Kennung zxx erst später eingeführt.^[21] Sie kann für die Kennzeichnung von Dokumenten verwendet werden, die keinen Text enthalten, z. B. Notendrucke oder Fotos.^[22]

Zwei weitere besondere Kennungen sind mul (von englisch multiple languages für „mehrere Sprachen“), der für die Auszeichnung mehrerer Sprachen gedacht ist, wenn eine Kennzeichnung durch alle einzelnen Kennungen nicht angebracht ist, sowie und (von englisch undetermined für „unbekannt“) für eine nicht identifizierbare Sprache.^[23]

Bezeichnung der Sprache nach RFC 5646

Zusammenfassung

Kontext

Eine Kombination der Sprachcodes der ISO-639-Norm mit weiteren Normen zur Kennzeichnung von Sprachen und Schriften wird durch die RFC 5646^[24] gegeben. Dort wird das Zusammenspiel von Sprachcodes (ISO 639), geographischen Codes (ISO 3166-1) und Schriftcodes (ISO 15924) beschrieben. Das gilt als best current practice BCP47.

Die Norm ISO 3166-1 kennzeichnet geographische Entitäten und kann so für die Bezeichnung von Sprachen und Dialekten einer bestimmten Region genutzt werden. Wie ISO 639-1 verwendet auch ISO 3166-1 zwei-buchstabige Kürzel. Dort wird empfohlen, geographische Codes in Großbuchstaben darzustellen. Sprach- und Regionscodes überschneiden sich, so bezeichnet de nach ISO 639-1 die deutsche Sprache und DE nach ISO 3166-1 das Land Deutschland, fr die französische Sprache und FR analog das Gebiet des Staates Frankreich. Es können aber gleiche Codes in den verschiedenen Standards auch unterschiedliche Begrifflichkeiten markieren, wie BE für Belgien und be für die belarussische Sprache, EU für die Europäische Union und eu andererseits für die baskische Sprache („Euskara“). Diese Überschneidungen spielen aber in der Praxis keine Rolle, da immer der Sprachcode an erster Stelle – vor dem Bindestrich – steht.

Mit ISO 15924 können Schriftsysteme identifiziert werden. Typischerweise werden sie mit einem vier-buchstabigen Code dargestellt, dessen erster Buchstabe in der Regel groß geschrieben wird. So stehen Cyrl für die Schrift nach dem kyrillischen Alphabet und Latn für die Schrift nach dem lateinischen Alphabet.

Ein Beispiel für einen Code nach RFC 5646^[24] ist fr-Latn-CA für Französisch nach dem lateinischen Alphabet wie es in Kanada geschrieben wird.

RFC 5646^[24] verlangt, dass zwischen Groß- und Kleinschreibung nicht unterschieden wird. So ist z. B. fr-Latn-CA identisch mit fr-latn-ca. Gleichwohl ist für Menschen nach außen in Groß- und Kleinschreibung darzustellen, während das bei der internen Verarbeitung ignoriert werden muss.

Beispiele der Sprachkennungen nach ISO 639

Zusammenfassung

Kontext

Diese Tabelle zeigt (sortiert nach Sprachcodes) die verschiedenen Spracheinträge und stellt Zusammenhänge zwischen den Teilnormen der ISO 639 dar. So werden lebendige, historische und künstliche Sprachen aufgeführt. Manche Kennungen existieren nicht in den anderen Normen, oder sie existieren in einer anderen Form.

Weitere Informationen Sprache, Art des Beispiels ...

Sprache	ISO 639-1	ISO 639-2 (B/T)	ISO 639-3	Art des Beispiels
Altkirchenslawisch	cu	chu	chu	historische Sprache, Sakralsprache
Deutsch	de	ger/deu	deu	B- und T-Kennung für ISO 639-2
Esperanto	eo	epo	epo	konstruierte Sprache (Plansprache)
Altgriechisch	–	grc	grc	historische Sprache, Sakralsprache, wissenschaftliche Fachterminologie (v. a. Medizin und Geisteswissenschaften)
Obersorbisch	–	hsb	hsb	Minderheitensprache
irokesische Sprachen	–	iro	–	kollektive Kennung für Sprachfamilie
japanische Sprache	ja	jpn	jpn	Alpha-2- und Alpha-3-Kennung teilen sich nicht zwei Buchstaben
Latein	la	lat	lat	historische Sprache, Sakralsprache, wissenschaftliche Fachterminologie (v. a. Medizin)
Lettgallisch	lv	lav	lav	fällt ohne eigenen Eintrag unter die lettische Sprache^[25]
ladakhische Sprache	–	sit	lbj	Sprache ohne eigenen Sprachcode für ISO 639-2, dort unter sonstige sinotibetische Sprachen
Sanskrit	sa	san	san	historische Sprache, als Zweitsprache noch in Verwendung
nordsamische Sprache	se	sme	sme	Sprache mit eigenem Sprachcode, trotz Existenz einer zugehörigen, kollektiven Kennung
andere samische Sprachen	–	smi	–	Sprachfamilie mit kollektiver Kennung, nur für Sprachen ohne eigenen Eintrag
Klingonisch	–	tlh	tlh	konstruierte Sprache, für die Unterhaltungsbranche erfunden
chinesische Sprachen	zh	chi/zho	zho	Eintrag für Sprachfamilie mit gleicher Schriftsprache aber ohne gegenseitige Verständlichkeit in der gesprochenen Sprache; in ISO 639-3 Makrosprache

Schließen

Weitere Vorläufer und verwandte Standards

Im deutschen Sprachraum wurde früher die 1986 verabschiedete Norm DIN 2335 verwendet.
ISO 15924 (Script Codes) zur Kennzeichnung von Schriftsystemen
Die Library of Congress führt auch die MARC Code List for Languages.^[8]
Die National Information Standards Organization führt mit ANSI/NISO Z39.53 (Codes for the Representation of Languages for Information Interchange) einen Standard zu Sprachkennungen, der ebenfalls durch die Library of Congress verwaltet wird.

Siehe auch

Weblinks

Registrierungsstelle zur ISO 639-2. Library of Congress (englisch)
Registrierungsstelle zur ISO 639-3. SIL International (englisch)
Registrierungsstelle zur ISO 639-5. Library of Congress (englisch)

Nachschlagelisten:

Kodierliste ISO 639-1, 2. Bibliotheksverbund Bayern (deutsch, aber englisch sortiert)
Kodierliste ISO 639-1, 2/5, 3. SIL International (englisch)
Kodierliste ISO 639-2. Library of Congress (englisch / französisch / deutsch)
Kodierliste ISO 639-5. Library of Congress (englisch)

Sonstiges:

Basisinformationen zu den Sprachen (mit linguistischer Hierarchie), sortiert nach ISO 639. ethnologue.com (englisch)
Wissenschaftliche Literatur, sortiert nach ISO 639. SIL International (englisch)

Einzelnachweise

[1]
Frequently Asked Questions (FAQ) – Codes for the representation of names of languages (Library of Congress). In: ISO 639-2 Registration Authority. Library of Congress, abgerufen am 24. Oktober 2006 (englisch).
[2]
Internationale Organisation für Normung (ISO) (Hrsg.): Codes for the representation of names of languages – Part 3: Alpha-3 code for comprehensive coverage of languages. 1. Auflage. 1. Februar 2007.
[3]
RFC: <a href='https://datatracker.ietf.org/doc/html/rfc1766' class='extiw' title='rfc:1766'>1766</a> – Tags for the Identification of Languages. März 1995 (englisch).
[4]
H. Alvestrand: RFC: <a href='https://datatracker.ietf.org/doc/html/rfc3066' class='extiw' title='rfc:3066'>3066</a> – Tags for the Identification of Languages. Januar 2001 (englisch).
[5]
Registration Authority bei der Library of Congress: Codes for the Representation of Names of Languages • Codes arranged alphabetically by alpha-3/ISO 639-2 Code
[6]
ISO 639 – Language Codes. In: infoterm.info. Abgerufen am 28. Februar 2015 (englisch).
[7]
Working principles for ISO 639 maintenance. In: ISO 639-2 Registration Authority. Library of Congress, 2. Juni 2006, abgerufen am 5. August 2007.
[8]
MARC Code List for Languages. In: MARC. Library of Congress, 17. Dezember 2007, abgerufen am 31. Dezember 2007.
[9]
ISO 639 codes arranged alphabetically by alpha-3 code: downloadable text files. In: ISO 639-2 Registration Authority. Library of Congress, 29. Oktober 2007, abgerufen am 8. November 2007.
[10]
ISO 639-3:2007. In: ISO Standards. Internationale Organisation für Normung (ISO), abgerufen am 6. August 2007.
[11]
Relationship between ISO 639-3 and the other parts of ISO 639. In: ISO 639-3. SIL International, abgerufen am 28. März 2007.
[12]
Deutschschweizer Dialektkarte, GIS-Wiki der Hochschule für Technik Rapperswil HSR.
[13]
COPTIC: an extinct language of Egypt. In: Ethnologue 14. SIL International, abgerufen am 5. August 2007.
[14]
ISO 639-3 Macrolanguage Mappings. In: ISO 639-3. SIL International, abgerufen am 28. März 2007.
[15]
Scope of denotation for language identifiers – Macrolanguages. In: ISO 639-3. SIL International, abgerufen am 28. März 2007.
[16]
John Cowan, Don Osborn: Wikimedia language codes. E-Mail-Austausch zwischen John Cowan und Don Osborn auf der Mailingliste ietf-languages, 13. September 2006
[17]
John Cowan, Peter Constable: What’s the plan for ISO 639-3 and RFC 3066 ter?. E-Mail-Austausch zwischen John Cowan und Peter Constable auf der Mailingliste ietf-languages, 20. August 2004
[18]
ISO/DIS 639-4. Internationale Organisation für Normung (ISO), abgerufen am 5. Dezember 2010.
[19]
ISO 639-6:2009 – Codes for the representation of names of languages – Part 6: Alpha-4 code for comprehensive coverage of language variants. International Organization for Standardization, Dezember 2009, abgerufen am 28. März 2018.
[20]
Lee Gillam, Debbie Garside, Chris Cox: Developments in Language Codes standards. In Rehm, Witt, Lemnitzer (Hrsg.): Datenstrukturen für linguistische Ressourcen und ihre Anwendungen / Data Structures for Linguistic Resources and Applications. Proc. of GLDV 2007, 11–13 April 2007. Gunter Narr Verlag, Tübingen. ISBN 978-3-8233-6314-9.
[21]
siehe z. B. die Änderungsmitteilung zu ISO 639-2: Change Notice. In: ISO 639-2 Registration Authority. Library of Congress, 29. September 2006, abgerufen am 26. Oktober 2006.
[22]
Aktualisierung der Sprachcodes nach ISO 639-2. Hessisches BibliotheksInformationsSystem, 26. Oktober 2006, archiviert vom Original (nicht mehr online verfügbar) am 1. September 2007; abgerufen am 26. Oktober 2006. Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.hebis.de
[23]
Codes for the Representation of Names of Languages-Part 2: Alpha-3 Code – Normative Text. In: ISO 639-2 Registration Authority. Library of Congress, 2. Juni 2006, abgerufen am 30. Oktober 2006.
[24]
RFC: <a href='https://datatracker.ietf.org/doc/html/rfc5646' class='extiw' title='rfc:5646'>5646</a> – Tags for Identifying Languages. September 2009 – Standard: [BCP-47] (englisch).
[25]
MARC Code List for Languages. In: MARC. Library of Congress, 26. März 2008, abgerufen am 15. Juni 2008.

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.

Wikiwand for Chrome

Wikiwand for Edge

Wikiwand for Firefox

Anwendung

Der Code ist in Kleinschreibung definiert. Damit wird eindeutig zwischen Sprachcode (Kleinschreibung) und den Ländercodes nach Standard ISO 3166 (Großschreibung) unterschieden.

Die Sprachcodes dieser Norm umfassen natürliche Sprachen und Plansprachen, aber keine Sprachen, die für die maschinelle Verarbeitung erstellt wurden, wie z. B. Programmiersprachen.

Teilnormen

Zusammenfassung

Kontext

Die offiziell eingeführten Teilnormen waren:^[2]

ISO 639-1:2002 – Codes for the representation of names of languages – Part 1: Alpha-2 code
ISO 639-2:1998 – Codes for the representation of names of languages – Part 2: Alpha-3 code
ISO 639-3:2007 – Codes for the representation of names of languages – Part 3: Alpha-3 code for comprehensive coverage of languages
ISO 639-4:2010 – Codes for the representation of names of languages – Part 4: Implementation guidelines and general principles for language coding
ISO 639-5:2008 – Codes for the representation of names of languages – Part 5: Alpha-3 code for language families and groups
ISO 639-6:2009 – Codes for the representation of names of languages – Part 6: Alpha-4 representation for comprehensive coverage of language variation

Weitere Informationen 639-1, 639-2 ...

Schematische Übersicht der Teilnormen ISO-639
	ISO 639-1	ISO 639-2	ISO 639-3	ISO 639-5
Einträge	183	487	7921	115
Mögliche Kombinationen	676	17.576	17.576	17.576
Einzelsprachen	Einzelsprachen und Sprachgruppen mit starker gemeinsamer Zugehörigkeit		Einzelsprachen (auch Makrosprachen)
Kollektive Gruppen	^*)	Kollektive Gruppen für Sprachfamilien oder übrige Sprachen einer Familie		Kollektive Gruppen für Sprachfamilien

Schließen

^*)

ISO 639-1 schloss mit Bihari (bh) einen kollektiven Sprachcode für eine Sprachgruppe ein, bis er 2021-05-25 ungültig wurde.

ISO 639-1

ISO 639-2

Die US-amerikanische Library of Congress übernimmt die Pflege dieser Teilnorm und veröffentlicht die aktuelle Codeliste.^[5]

Unter den hinzugekommenen Kennungen sind historische Sprachen wie Mittelhochdeutsch (gmh für German, Middle High) oder Althochdeutsch (goh für German, Old High).

Kollektive Sprachcodes

Terminologische und bibliographische Sprachcodes (T/B)

Änderungen

ISO 639-3

Makrosprachen

es existiert eine einzelne hochentwickelte Sprache, die von Sprechern verwandter Sprachen verwendet wird, unter dem Eindruck einer gemeinsamen Identität (arabische Sprache),
es existiert eine gemeinsame geschriebene Form (chinesische Sprachen mit der chinesischen Schrift) oder
verschiedene Gruppen entwickeln sich getrennt, so dass eine eindeutige Kennzeichnung nötig ist, eine gemeinsame Identität aber noch existiert (kroatische Sprache, serbische Sprache, bosnische Sprache).

ISO 639-4

Eine Erklärung zur Anwendung der Normen aus ISO 639 findet man in der Norm ISO 639-4. Diese Norm selbst definiert keine Sprachcodes.^[17] Die Veröffentlichung erfolgte im Juli 2010.^[18]

ISO 639-5

ISO 639-6

Integration und Beziehungen der einzelnen Normen

Verwaltung

Spezielle Kennungen

Die Kennungen von qaa bis qtz (inklusive der alphabetisch dazwischen liegenden Kennungen) sind für die lokale Verwendung registriert und werden von der Registrierungsstelle nicht vergeben.

Bezeichnung der Sprache nach RFC 5646

Zusammenfassung

Kontext

Ein Beispiel für einen Code nach RFC 5646^[24] ist fr-Latn-CA für Französisch nach dem lateinischen Alphabet wie es in Kanada geschrieben wird.

Beispiele der Sprachkennungen nach ISO 639

Zusammenfassung

Kontext

Weitere Informationen Sprache, Art des Beispiels ...

Sprache	ISO 639-1	ISO 639-2 (B/T)	ISO 639-3	Art des Beispiels
Altkirchenslawisch	cu	chu	chu	historische Sprache, Sakralsprache
Deutsch	de	ger/deu	deu	B- und T-Kennung für ISO 639-2
Esperanto	eo	epo	epo	konstruierte Sprache (Plansprache)
Altgriechisch	–	grc	grc	historische Sprache, Sakralsprache, wissenschaftliche Fachterminologie (v. a. Medizin und Geisteswissenschaften)
Obersorbisch	–	hsb	hsb	Minderheitensprache
irokesische Sprachen	–	iro	–	kollektive Kennung für Sprachfamilie
japanische Sprache	ja	jpn	jpn	Alpha-2- und Alpha-3-Kennung teilen sich nicht zwei Buchstaben
Latein	la	lat	lat	historische Sprache, Sakralsprache, wissenschaftliche Fachterminologie (v. a. Medizin)
Lettgallisch	lv	lav	lav	fällt ohne eigenen Eintrag unter die lettische Sprache^[25]
ladakhische Sprache	–	sit	lbj	Sprache ohne eigenen Sprachcode für ISO 639-2, dort unter sonstige sinotibetische Sprachen
Sanskrit	sa	san	san	historische Sprache, als Zweitsprache noch in Verwendung
nordsamische Sprache	se	sme	sme	Sprache mit eigenem Sprachcode, trotz Existenz einer zugehörigen, kollektiven Kennung
andere samische Sprachen	–	smi	–	Sprachfamilie mit kollektiver Kennung, nur für Sprachen ohne eigenen Eintrag
Klingonisch	–	tlh	tlh	konstruierte Sprache, für die Unterhaltungsbranche erfunden
chinesische Sprachen	zh	chi/zho	zho	Eintrag für Sprachfamilie mit gleicher Schriftsprache aber ohne gegenseitige Verständlichkeit in der gesprochenen Sprache; in ISO 639-3 Makrosprache

Schließen

Weitere Vorläufer und verwandte Standards

Im deutschen Sprachraum wurde früher die 1986 verabschiedete Norm DIN 2335 verwendet.
ISO 15924 (Script Codes) zur Kennzeichnung von Schriftsystemen
Die Library of Congress führt auch die MARC Code List for Languages.^[8]
Die National Information Standards Organization führt mit ANSI/NISO Z39.53 (Codes for the Representation of Languages for Information Interchange) einen Standard zu Sprachkennungen, der ebenfalls durch die Library of Congress verwaltet wird.

Siehe auch

Weblinks

Registrierungsstelle zur ISO 639-2. Library of Congress (englisch)
Registrierungsstelle zur ISO 639-3. SIL International (englisch)
Registrierungsstelle zur ISO 639-5. Library of Congress (englisch)

Nachschlagelisten:

Kodierliste ISO 639-1, 2. Bibliotheksverbund Bayern (deutsch, aber englisch sortiert)
Kodierliste ISO 639-1, 2/5, 3. SIL International (englisch)
Kodierliste ISO 639-2. Library of Congress (englisch / französisch / deutsch)
Kodierliste ISO 639-5. Library of Congress (englisch)

Sonstiges:

Basisinformationen zu den Sprachen (mit linguistischer Hierarchie), sortiert nach ISO 639. ethnologue.com (englisch)
Wissenschaftliche Literatur, sortiert nach ISO 639. SIL International (englisch)

Einzelnachweise

[1]
Frequently Asked Questions (FAQ) – Codes for the representation of names of languages (Library of Congress). In: ISO 639-2 Registration Authority. Library of Congress, abgerufen am 24. Oktober 2006 (englisch).
[2]
Internationale Organisation für Normung (ISO) (Hrsg.): Codes for the representation of names of languages – Part 3: Alpha-3 code for comprehensive coverage of languages. 1. Auflage. 1. Februar 2007.
[3]
RFC: <a href='https://datatracker.ietf.org/doc/html/rfc1766' class='extiw' title='rfc:1766'>1766</a> – Tags for the Identification of Languages. März 1995 (englisch).
[4]
H. Alvestrand: RFC: <a href='https://datatracker.ietf.org/doc/html/rfc3066' class='extiw' title='rfc:3066'>3066</a> – Tags for the Identification of Languages. Januar 2001 (englisch).
[5]
Registration Authority bei der Library of Congress: Codes for the Representation of Names of Languages • Codes arranged alphabetically by alpha-3/ISO 639-2 Code
[6]
ISO 639 – Language Codes. In: infoterm.info. Abgerufen am 28. Februar 2015 (englisch).
[7]
Working principles for ISO 639 maintenance. In: ISO 639-2 Registration Authority. Library of Congress, 2. Juni 2006, abgerufen am 5. August 2007.
[8]
MARC Code List for Languages. In: MARC. Library of Congress, 17. Dezember 2007, abgerufen am 31. Dezember 2007.
[9]
ISO 639 codes arranged alphabetically by alpha-3 code: downloadable text files. In: ISO 639-2 Registration Authority. Library of Congress, 29. Oktober 2007, abgerufen am 8. November 2007.
[10]
ISO 639-3:2007. In: ISO Standards. Internationale Organisation für Normung (ISO), abgerufen am 6. August 2007.
[11]
Relationship between ISO 639-3 and the other parts of ISO 639. In: ISO 639-3. SIL International, abgerufen am 28. März 2007.
[12]
Deutschschweizer Dialektkarte, GIS-Wiki der Hochschule für Technik Rapperswil HSR.
[13]
COPTIC: an extinct language of Egypt. In: Ethnologue 14. SIL International, abgerufen am 5. August 2007.
[14]
ISO 639-3 Macrolanguage Mappings. In: ISO 639-3. SIL International, abgerufen am 28. März 2007.
[15]
Scope of denotation for language identifiers – Macrolanguages. In: ISO 639-3. SIL International, abgerufen am 28. März 2007.
[16]
John Cowan, Don Osborn: Wikimedia language codes. E-Mail-Austausch zwischen John Cowan und Don Osborn auf der Mailingliste ietf-languages, 13. September 2006
[17]
John Cowan, Peter Constable: What’s the plan for ISO 639-3 and RFC 3066 ter?. E-Mail-Austausch zwischen John Cowan und Peter Constable auf der Mailingliste ietf-languages, 20. August 2004
[18]
ISO/DIS 639-4. Internationale Organisation für Normung (ISO), abgerufen am 5. Dezember 2010.
[19]
ISO 639-6:2009 – Codes for the representation of names of languages – Part 6: Alpha-4 code for comprehensive coverage of language variants. International Organization for Standardization, Dezember 2009, abgerufen am 28. März 2018.
[20]
Lee Gillam, Debbie Garside, Chris Cox: Developments in Language Codes standards. In Rehm, Witt, Lemnitzer (Hrsg.): Datenstrukturen für linguistische Ressourcen und ihre Anwendungen / Data Structures for Linguistic Resources and Applications. Proc. of GLDV 2007, 11–13 April 2007. Gunter Narr Verlag, Tübingen. ISBN 978-3-8233-6314-9.
[21]
siehe z. B. die Änderungsmitteilung zu ISO 639-2: Change Notice. In: ISO 639-2 Registration Authority. Library of Congress, 29. September 2006, abgerufen am 26. Oktober 2006.
[22]
Aktualisierung der Sprachcodes nach ISO 639-2. Hessisches BibliotheksInformationsSystem, 26. Oktober 2006, archiviert vom Original (nicht mehr online verfügbar) am 1. September 2007; abgerufen am 26. Oktober 2006. Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.hebis.de
[23]
Codes for the Representation of Names of Languages-Part 2: Alpha-3 Code – Normative Text. In: ISO 639-2 Registration Authority. Library of Congress, 2. Juni 2006, abgerufen am 30. Oktober 2006.
[24]
RFC: <a href='https://datatracker.ietf.org/doc/html/rfc5646' class='extiw' title='rfc:5646'>5646</a> – Tags for Identifying Languages. September 2009 – Standard: [BCP-47] (englisch).
[25]
MARC Code List for Languages. In: MARC. Library of Congress, 26. März 2008, abgerufen am 15. Juni 2008.

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.

Wikiwand for Chrome

Wikiwand for Edge

Wikiwand for Firefox