უნიკოდი
From Wikipedia, the free encyclopedia
უნიკოდი — სიმბოლოთა სტანდარტი, რომელიც საშუალებას იძლევა გამოვხატოთ პრაქტიკულად ყველა ენის დამწერლობის ნიშნები (სიმბოლოები, ასოები). უნიკოდი წარმოდგენილია რამდენიმე ფორმით: UTF-8, UTF-16 (UTF-16BE, UTF-16LE) და UTF-32 (UTF-32BE, UTF-32LE). აგრეთვე შემუშავებულია UTF-7, შვიდ ბიტიანი არხით ინფორმაციის გადაცემისთვის, მაგრამ ეს ფორმა, ASCII-სთან შეუთავსებლობის გამო, არ არის დამკვიდრებული და არ შედის უნიკოდის სტანდარტში.
Microsoft-ის Windows NT-ში, მასზე დაფუძნებულ სხვა სისტემებში: Windows 2000, Windows XP - (უნიკოდი Microsoft ოპერაციულ სისტემებში) ძირითადად გამოიყენება UTF-16LE. UNIX-ში და მსგავს ოპერაციულ სისტემებში - GNU/Linux, BSD და მაკ ოს X მიღებულია: ფაილებისთვის - UTF-8 ფორმა; UTF-32 ან UTF-8 კი ოპერატიული მეხსიერების მონაცემთა დამუშავებისთვის.
სტადარტი შემოთავაზებულია 1991 წ. - არაკომერციული ორგანიზაციის ”უნიკოდის კონსორციუმი”-ს მიერ. , რომელიც აერთიანებს უმსხვილეს IT (ინტერნეტ ტექნოლოგიების) კორპორაციებს. ამ სტანდარტის გამოყენება საშუალებას იძლევა გავუკეთოთ კოდირება ძალზე მაღალი რაოდენობის სიმბოლოებს - სხვადასხვა დამწერლობებიდან: უნიკოდ დოკუმენტებში, კოდური გვერდის გამოყენების გარეშე, გვერდიგვერდ თავსდებიან ჩინური იეროგლიფები, მათემატიკური სიმბოლოები, ბერძნული ალფავიტის ასოები და კირილიცა.
უნიკოდის სტანდარტში კოდები დაყოფილია რამდენიმე ჯგუფად. U+0000-დან U+007F-მდე ჯგუფი შეიცავს ASCII სიმბოლოებს, შესაბამისი კოდებით. შემდეგ ჯგუფებში მოთავსებულია სხვადასხვა დამწერლობის ნიშნები, პუნქტუაციის ნიშნები და ტექნიკური სიმბოლოები. კირილიცის სიმბოლოებს ეთმობა U+0400-დან U+052F-მდე ჯგუფი.