Remove ads
From Wikipedia, the free encyclopedia
Ur standard er stlenneg eo Unicode ®, bet savet gant Unicode Consortium e Mountain View (Kalifornia) hag embannet e 1991 evit ar wezh kentañ a-benn kemer lec'h ar c'hodoù evel ISO 8859-1, pa oa meur a hini anezho evit meur a rumm yezh.
Unicode a ro da bep arouezenn e ne vern peseurt reizhiad doare-skrivañ, un niver, un anv hag ur c'hodadur hepken en un doare unvan, a ya en-dro dre ne vern peseurt reizhiad urzhiataerezh pe veziant.
E gwirionez n'eo ket bet enboneget an holl reizhiadoù skritur c'hoazh, abalamour da labourioù enklask ret n'hallont bezañ graet nemet gant arbennigourien, evit arouezennoù dibaot-kenañ pe reizhiadoù nebeut-anavezet pe aet da get. An darn vuiañ eus ar reizhiadoù a vez implijet er bed zo dija en Unicode koulskoude.
Liammet eo Unicode Consortium gant ar reolad etrebroadel ISO/IEC (International Electrotechnical Commission) 10646 hag a labour war an hevelep tachenn, met ar reolad ne bled na gant ar sevel arouezennoù na gant o sterva.
Unicode a ra war-dro al lizherennegoù hag an doare da gevreañ al lizherennoù hag an arouezennoù diakritek, da skouer ñ, Ç ha ش.
En doare UTF-8 e c'hall ar reolad Unicode labourat gant ar reolad ASCII (American Standard Code for Information Interchange).
Unicode 12.0 eo ar stumm nevesañ abaoe ar 5 a viz Meurzh 2019 : 137 928 arouezenn zo ennañ.
Kudennoù a chom c'hoazh gant an arouezlunioù sinaat, a vez implijet e meur a yezh gant kemmadennoùigoù a c'hall bezañ pouezus evit al lennerien.
Stummoù nevesañ Unicode | ||
---|---|---|
Stumm | Deiziad | Nevezintioù |
5.0 | Gouere 2006 | |
5.1 | Meurzh 2008 | |
5.2 | Here 2009 | |
6.0 | C'hwevrer 2011 | |
6.1 | 31 Genver 2012 | |
7.0 | 16 Mezheven 2014 | + 2 834 arouezenn, 250 emoji en o zouez[1] |
8.0 | 17 Mezheven 2015 | + 7 716 arouezenn hag emoji[2]. |
9.0 | 21 Mezheven 2016 | + 7 500 arouezenn, 72 emoji en o zouez[3]. |
10.0 | 20 Mezheven 2017 | + 8 518 arouezenn, 56 emoji en o zouez[4]. |
11.0 | 5 Mezheven 2018 | + 684 arouezenn, 66 emoji en o zouez[5]. |
12.0 | 5 Meurzh 2019 | + 554 arouezenn, 61 emoji en o zouez – 137 928 arouezenn en holl –[6]. |
Re strizh e oa ar reoladoù kozh : un heuliad bitoù a dalveze evit ul arouezenn ; gant 7 bit e ra ASCII, hag ar reolad ISO/CEI 8859-1 a implij 8 bit evel an darn vuiañ eus ar yezhoù. Tud Unicode o deus dibabet ober gant bitoù evit termeniñ al arouezennoù ha bitoù all evit o c'hodiñ : 16 bit (2 okted) a voe implijet er stummoù kentañ, ha 32 vit (4 okted) a voe e stummoù kentañ ar reolad ISO/CEI 10646.
Unvanet eo bet an daou zoare dre implijout 20 pe 21 bit dre arouezenn.
Ar furmad hollek UTF-x (Universal Transformation Format) a vez degemeret gant Unicode hag ISO/CEI 10646 ; x eo an niver bihanañ a vitoù implijet e vit kodiñ.
Unicode ne ra nemet listañ arouezennoù ha reiñ un niverenn da bep hini anezho. Ne reoilh ket an doare d'o diskwel war ar skramm pe war ar paper. N'eus liamm ebet etre tres un arouezenn hag he niverenn, pa'z eus unan en ur font ASCII pe ISO/CEI 8859-1 (Latin1, implijet en Afrika, Amerika, Europa ar C'hornaoueg hag Okeania).
Da skouer, daou zoare zo da godiñ an arouezenn ñ : dre un niverenn hepken (arouezenn ragaozet) pe dre niverenn al lizherenn n heuliet gant niverenn an dildenn hep foet (arouezenn liesparzh)[7]. Evit ar lagad e vez gwelloc'h implijout arouezennoù ragaozet.
Gant reizhiadoù skritur evel an devanāgarī pe al lizherenneg arabek e vez labourus-tre ragaozañ ereadurioù : kemm-digemm e vez ar grafemennoù hervez o lerc'h er ger ha hervez ar grafemennoù amezek.
Setu emañ skoemp komz eus fontoù Unicode rak sevel ur font gant an holl lizherennoù pe arouezlunioù kevret gant o arouezennoù diakritek hag o ereadurioù n'eo ket a-walc'h : ret eo kaout ur benveg gouest da zivizout peseurt hini implijout.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.