Loading AI tools
ตัวอักษร จากวิกิพีเดีย สารานุกรมเสรี
อักษรไทย เป็นอักษรที่ใช้เขียนภาษาไทยและภาษาของกลุ่มชาติพันธุ์ต่างๆ เช่น คำเมือง, อีสาน, ภาษาไทยใต้, มลายูปัตตานี เป็นต้น ในประเทศไทย มีพยัญชนะ 44 รูป สระ 21 รูป วรรณยุกต์ 4 รูป และเครื่องหมายอื่น ๆ อีกจำนวนหนึ่ง พยัญชนะไทยจะเรียงตัวไปตามแนวนอน จากซ้ายไปขวา ส่วนสระจะอยู่หน้า บน ล่าง และหลังพยัญชนะประกอบคำแล้วแต่ชนิดของสระ
บทความนี้ยังต้องการเพิ่มแหล่งอ้างอิงเพื่อพิสูจน์ความถูกต้อง |
อักษรไทย | |
---|---|
ชนิด | |
ผู้ประดิษฐ์ | พ่อขุนรามคำแหงมหาราช[ใคร?] |
ช่วงยุค | พ.ศ. 1826 (ค.ศ. 1283) – ปัจจุบัน |
ทิศทาง | ซ้ายไปขวา |
ภาษาพูด | มาตรฐาน: ภาษาไทย, ภาษาไทยใต้ ไม่เป็นมาตรฐาน: คำเมือง, อีสาน, มลายูปัตตานี, และอื่นๆ |
อักษรที่เกี่ยวข้อง | |
ระบบแม่ | ชุดตัวอักษรไซนายดั้งเดิม |
ระบบลูก | อักษรไทเวียด |
ระบบพี่น้อง | อักษรฝักขาม อักษรลาว |
ISO 15924 | |
ISO 15924 | Thai (352), Thai |
ยูนิโคด | |
ยูนิโคดแฝง | Thai |
ช่วงยูนิโคด | U+0E00–U+0E7F |
อักษรไทยไม่มีการแยกอักษรตัวใหญ่หรืออักษรตัวเล็กอย่างอักษรโรมัน และไม่มีการเว้นวรรคระหว่างคำ เมื่อจบหนึ่งประโยคจะลงท้ายด้วยการเว้นวรรค กับมีเครื่องหมายวรรคตอนจำนวนหนึ่ง
ภาษาไทยมีเลขไทยเป็นของตัวเอง แต่นิยมใช้ตัวเลขอาหรับเป็นส่วนใหญ่ในชีวิตประจำวัน
ราว พ.ศ. 400 ไทยได้อพยพจากถิ่นเดิมมาตั้งภูมิลำเนาอยู่ใกล้อาณาเขตมอญ ซึ่งกำลังเป็นชาติที่เจริญรุ่งเรืองในสมัยนั้น เริ่มแรกคงเริ่มเลียนแบบตัวอักษรมาจากมอญ ต่อมาราว พ.ศ. 1500 เมื่อขอมขยายอำนาจเข้ามาในดินแดนของคนไทยซึ่งตั้งอยู่บริเวณริมแม่น้ำยม และได้ปกครองเมืองเชลียงและเมืองสุโขทัย ไทยก็เริ่มดัดแปลงอักษรที่มีอยู่เดิมให้คล้ายกับอักษรขอมหวัด
อักษรมอญและอักษรขอมที่ไทยนำมาดัดแปลงใช้นั้นล้วนเป็นอักษรที่รับและแปลงรูปมาจากอักษรพราหมี ของพวกพราหมณ์ซึ่งแพร่หลายในอินเดียตอนเหนือ และอักษรสันสกฤตในสมัยราชวงศ์ปัลลวะ ซึ่งแพร่หลายบริเวณอินเดียตอนใต้ อักษรอินเดียทั้งคู่นี้ต่างก็รับแบบมาจากอักษรฟินิเชียนอีกชั้นหนึ่ง อักษรเฟนีเซียนับได้ว่าเป็นอักษรที่เก่าแก่ที่สุด และเป็นแม่แบบตัวอักษรของชาติต่างๆ ทั้งในเอเชียและยุโรป
ราว พ.ศ. 1826 พ่อขุนรามคำแหงทรงประดิษฐ์อักษรไทยที่เรียกกันว่า "ลายสือไทย" ขึ้น[ใคร?] ซึ่งได้เค้ารูปมาจากอักษรมอญและอักษรขอมที่มีอยู่เดิม ทำให้อักษรไทยมีลักษณะคล้ายคลึงกับอักษรทั้งสอง แม้บางตัวจะไม่คล้ายกัน แต่ก็สามารถรู้ได้ว่าดัดแปลงมาจากอักษรตัวไหน
อักษรไทยมีการปรับปรุงอยู่เรื่อยๆ ในสมัยพญาฦๅไทราว พ.ศ. 1900 มีการแก้ไขตัวอักษรให้ผิดเพี้ยนไปบ้างเล็กน้อย โดยเฉพาะการเพิ่มเชิงที่ตัว ญ ซึ่งใช้ติดต่อเรื่อยมาจนทุกวันนี้ คาดว่าน่าจะเอาอย่างมาจากเขมร ในสมัยสมเด็จพระนารายณ์มหาราช ราว พ.ศ. 2223 ตัวอักษรเริ่มมีทรวดทรงดีขึ้นแต่ก็ไม่ทิ้งเค้าเดิม มีบางตัวเท่านั้นที่แก้ไขผิดไปจากเดิม คือตัว ฎ และ ธ ซึ่งเหมือนกับที่ใช้อยู่ในปัจจุบัน นักวิชาการจำนวนหนึ่งเชื่อว่าในสมัยสมเด็จพระนารายณ์มหาราช ตัวอักษรและการใช้งานมีความคล้ายคลึงกับในปัจจุบันมากที่สุด
พยัญชนะไทยมี 44 รูป แต่ละตัวมีชื่อเรียกโดยเฉพาะ สามารถแบ่งตามฐานที่ใช้ในการออกเสียงเป็นวรรค เสียงอ่านที่กำกับไว้คือเสียงเมื่อเป็นพยัญชนะต้น
วรรค | ฐานกรณ์ | กักสิถิล | กักธนิตหรือเสียดแทรก | นาสิก | |||||
---|---|---|---|---|---|---|---|---|---|
วรรค กะ | เพดานอ่อน | ก ไก่ [k~g] |
ข ไข่ [kʰ~x] |
ฃ ขวด¹ [kʰ~x] |
ค ควาย [kʰ~x] |
ฅ คน¹ [kʰ~x] |
ฆ ระฆัง [kʰ~x] |
ง งู [ŋ] | |
วรรค จะ | เพดานแข็ง | จ จาน [t͡ɕ] |
ฉ ฉิ่ง [t͡ɕʰ] |
ช ช้าง [t͡ɕʰ] |
ซ โซ่ [s~z~ɕ] |
ฌ เฌอ [t͡ɕʰ] |
ญ หญิง [ɲ]² | ||
วรรค ฏะ | ปุ่มเหงือก | ฎ ชฎา [d̪] |
ฏ ปฏัก [t̪] |
ฐ ฐาน [tʰ] |
ฑ มณโฑ [tʰ]/[d̪] |
ฒ ผู้เฒ่า [tʰ] | ณ เณร [n] | ||
วรรค ตะ | ด เด็ก [d̪] | ต เต่า [t̪] |
ถ ถุง [tʰ] |
ท ทหาร [tʰ] |
ธ ธง [tʰ] | น หนู [n] | |||
วรรค ปะ | ริมฝีปาก | บ ใบไม้ [b] | ป ปลา [p] |
ผ ผึ้ง [pʰ] | ฝ ฝา [f] |
พ พาน [pʰ] | ฟ ฟัน [f] |
ภ สำเภา [pʰ] | ม ม้า [m] |
ไตรยางศ์ | กลาง | สูง | ต่ำ |
วรรค | เปิดหรือรัว | เสียดแทรก | เปิดข้างลิ้น ปุ่มเหงือก | กัก เส้นเสียง | เสียดแทรก เส้นเสียง | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|
เศษวรรค | ย ยักษ์ [j] | ร เรือ [r~ɹ] | ล ลิง [l] | ว แหวน [ʋ~w] |
ศ ศาลา [s~z~ɕ] |
ษ ฤๅษี [s~z~ɕ] |
ส เสือ [s~z~ɕ] |
ห หีบ [h] |
ฬ จุฬา [l] | อ อ่าง³ [ʔ] | ฮ นกฮูก [h] |
ไตรยางศ์ | ต่ำ | สูง | ต่ำ | กลาง | ต่ำ |
พยัญชนะไทยยังแบ่งออกเป็น 3 หมู่ เรียกว่า ไตรยางศ์ ประกอบด้วย
ความถี่ของพยัญชนะไทย พยัญชนะไทยที่ใช้บ่อยที่สุดคือ น และที่ใช้น้อยที่สุดคือ ฅ ความถี่ที่แสดงในตารางอาจแตกต่างกันในทางปฏิบัติตามประเภทของข้อความ (ผู้อ่านสามารถทดลองเปิดหน้าข่าว หรือเปิดหนังสือ ebook สักเล่มแล้วลอง ค้นหา(search) อักษรโดดๆ เช่น ก ข ค ... จะพบว่าพยัญชนะไทยที่ใช้มากที่สุดในเอกสารนั้นคือ น (นอ หนู) หรืออาจจะเป็นตัวพยัญชนะ ร อ บ้างในบางเอกสารเท่านั้น)
ยูนิโคด | ชื่อตัวอักษร | พยัญชนะไทย | ความถี่ TNC v.1 | ความถี่ LEXiTRON Data 2.0 | ความถี่ พจนานุกรมราชบัณฑิตฯ 2554 |
---|---|---|---|---|---|
0E19 | NO NU | น | 9.68% | 8.61% | 8.29% |
0E23 | RO RUA | ร | 7.47% | 9.17% | 9.04% |
0E2D | O ANG | อ | 7.44% | 6.61% | 6.42% |
0E01 | KO KAI | ก | 7.35% | 7.54% | 7.79% |
0E07 | NGO NGU | ง | 6.90% | 6.26% | 5.66% |
0E21 | MO MA | ม | 6.24% | 5.77% | 5.78% |
0E22 | YO YAK | ย | 4.90% | 4.90% | 5.18% |
0E27 | WO WAEN | ว | 4.80% | 4.71% | 4.56% |
0E25 | LO LING | ล | 3.97% | 4.26% | 4.85% |
0E14 | DO DEK | ด | 3.96% | 3.89% | 3.60% |
0E17 | THO THAHAN | ท | 3.75% | 2.89% | 2.73% |
0E2B | HO HIP | ห | 3.59% | 3.26% | 3.67% |
0E15 | TO TAO | ต | 3.31% | 3.81% | 3.93% |
0E04 | KHO KHWAI | ค | 3.09% | 3.35% | 2.47% |
0E2A | SO SUA | ส | 3.07% | 3.84% | 4.13% |
0E1B | PO PLA | ป | 2.90% | 2.60% | 2.76% |
0E1A | BO BAIMAI | บ | 2.88% | 3.06% | 3.06% |
0E08 | CHO CHAN | จ | 2.69% | 2.05% | 1.98% |
0E02 | KHO KHAI | ข | 2.13% | 1.78% | 1.88% |
0E1E | PHO PHAN | พ | 1.95% | 2.27% | 2.43% |
0E0A | CHO CHANG | ช | 1.56% | 1.73% | 1.75% |
0E1C | PHO PHUNG | ผ | 0.86% | 0.87% | 0.72% |
0E16 | THO THUNG | ถ | 0.79% | 0.79% | 0.73% |
0E13 | NO NEN | ณ | 0.64% | 0.65% | 0.80% |
0E28 | SO SALA | ศ | 0.60% | 0.89% | 0.90% |
0E18 | THO THONG | ธ | 0.56% | 0.63% | 0.78% |
0E29 | SO RUSI | ษ | 0.47% | 0.56% | 0.60% |
0E0D | YO YING | ญ | 0.46% | 0.57% | 0.57% |
0E20 | PHO SAMPHAO | ภ | 0.44% | 0.61% | 0.70% |
0E0B | SO SO | ซ | 0.42% | 0.45% | 0.43% |
0E09 | CHO CHING | ฉ | 0.25% | 0.29% | 0.36% |
0E10 | THO THAN | ฐ | 0.20% | 0.15% | 0.20% |
0E1F | FO FAN | ฟ | 0.18% | 0.44% | 0.33% |
0E1D | FO FA | ฝ | 0.13% | 0.24% | 0.20% |
0E0F | TO PATAK | ฏ | 0.08% | 0.08% | 0.14% |
0E0E | DO CHADA | ฎ | 0.08% | 0.08% | 0.08% |
0E12 | THO PHUTHAO | ฒ | 0.07% | 0.04% | 0.04% |
0E2E | HO NOKHUK | ฮ | 0.06% | 0.10% | 0.12% |
0E11 | THO NANGMONTHO | ฑ | 0.03% | 0.11% | 0.14% |
0E06 | KHO RAKHANG | ฆ | 0.03% | 0.07% | 0.12% |
0E2C | LO CHULA | ฬ | 0.02% | 0.03% | 0.07% |
0E0C | CHO CHOE | ฌ | 0.003% | 0.01% | 0.03% |
0E03 | KHO KHUAT | ฃ | 0.001% | 0% | 0% |
0E05 | KHO KHON | ฅ | 0.0003% | 0% | 0% |
1นับความถี่จาก Thai National Corpus (1st version on CQPweb) จำนวน 34,782,267 โทเค็น
2นับความถี่ จากฐานข้อมูล LEXiTRON Data 2.0 จำนวนคำศัพท์ในพจนานุกรม 32,365 คำ เก็บถาวร 2017-09-27 ที่ เวย์แบ็กแมชชีน
สระในภาษาไทยมี 21 รูป ซึ่งรูปสระเหล่านี้จะนำไปประกอบเป็นรูปสระที่ใช้จริงอีกต่อหนึ่ง (ดูที่ ภาษาไทย)
วรรณยุกต์ในภาษาไทยมี 4 รูป 5 เสียง
เสียงวรรณยุกต์ไทยตามหลักภาษาศาสตร์ แบ่งได้ดังนี้
เครื่องหมายวรรณยุกต์ในภาษาไทย มี 4 รูป ดังนี้
ไม้เอก (-่) ไม้โท (-้) ไม้ตรี (-๊) และ ไม้จัตวา (-๋)
อย่างไรก็ตาม ในจารึกสมัยโบราณ เช่น ศิลาจารึกพ่อขุนรามคำแหง มีเครื่องหมายวรรณยุกต์เพียง 2 รูป คือ ไม้เอก (-่) และไม้โท (-๋)[ต้องการอ้างอิง] เช่น น๋อง (น้อง), ห๋า (ห้า)
โดยทั่วไปเสียงพยางค์หนึ่งในภาษาไทย สามารถผันได้ ๕ เสียงวรรณยุกต์ แต่ในภาษาเขียน จะมีกฎเกณฑ์การผันที่ตายตัว ดังนี้
หมู่อักษร-คำเป็นคำตาย | เสียงสามัญ | เสียงเอก | เสียงโท | เสียงตรี | เสียงจัตวา |
---|---|---|---|---|---|
อักษรกลาง คำเป็น | กา | ก่า | ก้า | ก๊า | ก๋า |
อักษรกลาง คำตาย สระสั้น | - | กะ | ก้ะ | ก๊ะ | ก๋ะ |
อักษรกลาง คำตาย สระยาว | - | กาบ | ก้าบ | ก๊าบ | ก๋าบ |
อักษรสูง คำเป็น | - | ข่า | ข้า | - | ขา |
อักษรสูง คำตาย สระสั้น | - | ขะ | ข้ะ | - | - |
อักษรสูง คำตาย สระยาว | - | ขาบ | ข้าบ | - | - |
อักษรต่ำ คำเป็น | คา | - | ค่า | ค้า | - |
อักษรต่ำ คำตาย สระสั้น | - | - | ค่ะ | คะ | ค๋ะ |
อักษรต่ำ คำตาย สระยาว | - | - | คาบ | ค้าบ | ค๋าบ |
คำตายของอักษรกลางและอักษรสูง ไม่ว่าสระจะเป็นเสียงสั้นหรือเสียงยาวก็ผันวรรณยุกต์ตามรูปแบบเดียวกัน เว้นแต่คำตายของอักษรต่ำ เมื่อเป็นสระเสียงสั้นหรือเสียงยาวจะผันคนละแบบ
อักษรต่ำและอักษรสูงไม่สามารถผันให้ครบ ๕ เสียงได้ จึงมักจะใช้อักษรเสียงเดียวกันจากอีกหมู่หนึ่งมาใช้เป็นอักษรนำ โดยมีอักษรสูงนำ (ยกเว้นอักษร อ ซึ่งเป็นอักษรกลาง สามารถนำ อักษร ย ได้) เช่น นา หน่า น่า น้า หนา, มี หมี่ มี่ มี้ หมี
ตัวเลขที่เป็นอักษรไทย เรียกว่าเลขไทย มีลักษณะดังนี้
วิธีการบอกจำนวนใช้ระบบประจำหลักเหมือนกับตระกูลตัวเลขอาหรับอื่น ๆ
|
ช่วงรหัสยูนิโคด (Unicode) ของอักษรไทย คือ U+0E00 ถึง U+0E7F
ไทย Unicode.org chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0E0x | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ | |
U+0E1x | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
U+0E2x | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
U+0E3x | ะ | ั | า | ำ | ิ | ี | ึ | ื | ุ | ู | ฺ | ฿ | ||||
U+0E4x | เ | แ | โ | ใ | ไ | ๅ | ๆ | ็ | ่ | ้ | ๊ | ๋ | ์ | ํ | ๎ | ๏ |
U+0E5x | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ | ||||
U+0E6x | ||||||||||||||||
U+0E7x |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.