En français, à la différence d'autres langues, les signes diacritiques ou les combinaisons de lettres (digrammes et ligatures) ne sont pas pris en compte dans l'ordre alphabétique primaire, ni dans les jeux de lettres (mots croisés, Scrabble,etc.); ces différences d'accents ou de ligatures sont prises en compte seulement au niveau ternaire, c’est-à-dire après le niveau secondaire (différences de casse), considéré plus important, et qui suit le classement alphabétique principal des mots selon les 26 classes de lettres.
Pour le classement alphabétique, les formes diacritées sont comptées comme celles non diacritées («é» compté comme «e») et les ligatures «æ» et «œ» sont comptées comme «ae» et «oe».
Les voyelles sont A, E, I, O, U, Y, les autres lettres étant les consonnes[4]. Les lettres I, U, Y et, rarement, W (sauf par exemple en Belgique), de même que les digrammes OU et O(I), peuvent en pratique servir de semi-voyelles.
Les diacritiques utilisés en français sont au nombre de cinq:
sur les voyelles:
l’accent aigu´: é; diacritique le plus courant, mais uniquement sur le «e»;
l’accent grave`: è; à; ù; très courant sur le e, qu'il ouvre, et sur le a et le u dans quelques mots courants dont il précise le sens sans en modifier la phonétique;
l’accent circonflexeˆ: ê; â; î; ô; û; assez courant sur le a, le e et le o dont il peut modifier la phonétique en les fermant ou les allongeant suivant les régions, et résiduel en voie d'obsolescence sur le i et le u où soit il symbolise une ancienne lettre amuïe, et maintenant complètement disparue dans certaines régions (sur le plan phonétique), soit il permet de différencier à l’écrit des homophones;
le tréma¨: ë; ï; ü; ÿ; sur le e pour indiquer l'absence des ligatures æ et œ comme dans Noël (et pas Nœl), ou Naël (et pas Næl), sur le i de quelques mots comme haï, et sur le u pour indiquer qu'il est prononcé séparément des autres sons (en particulier du g avant un e, i, ou u), comme dans aigüe[ɛ.gy] (en opposition avec aigue[ɛg]) ou dans argüer[aʁ.ɡɥe] (en opposition avec arguer[aʁ.ge]). Pour les mêmes raisons, mais parfois remplacé dans d'autres mots par un h muet avant le i, et parfois sur le y de certains noms propres comme L'Haÿ-les-Roses, prononcé [la.i.le.ʁoz] et non [lɛ.le.ʁoz].
sous le c:
la cédille¸: ç; assez courante sous le c pour en garder la prononciation [s] avant les voyelles a, u ou o, par exemple le mot ça et les mots et conjugaisons dérivés des verbes en -cer).
On y ajoute le trait d'union et l'apostrophe dans certains cas.
Deux ligatures orthographiques, d'origine latine, existent encore pour certains mots qui ne trouvent d'autres moyens d'écriture. Souvent abandonnées pour éviter la confusion avec 2 voyelles manuscrites, comme le -a- en -o- avec la ligature -æ-:
e dans l'o (o e liés/collés): œ (œil, fœtus, bœuf…)
e dans l'a (a e liés/collés): æ (tænia, ex æquo…). Notons que l'Académie française n'utilise pas la ligature de confusion manuscrite pour un certain nombre de ces mots, afin d'éviter l'erreur du -o- remplaçant le -a- dans ligature -æ-, comme dans tænia, ex æquo, curriculum Vitæ; ou retrouvée seulement sous la forme informatisée, ou auparavant dactylographiée avec l'apparition de l'imprimerie[5], mais écrit caecum et signale qu'on trouve aussi ex aequo, et caetera, et et caétera (-a- muet du français), ou et cetera sans accent.
Il existe aussi des ligatures esthétiques: ct, et (&), ff (ff), ffi (ffi), ffl (ffl), fi (fi), fl (fl), ft, st (st) et tt (d'usage courant en typographie, elles ne sont toutefois pas considérées comme des lettres distinctes sur le plan orthographique, sémantique ou étymologique.
des graphies consonantales:
des digrammes consonantaux insécables: ch, gu, ge (avant a, o, u), ph, qu (avant e), sh (dans certains mots importés de l'anglais) et le trigramme sch (dans certains mots d'origine germanique);
des digrammes consonantaux sécables, affectant la prononciation: ss;
des digrammes consonantaux sécables, souvent introduits par mutation orthographique d'un préfixe, et n'affectant normalement pas la prononciation de ce préfixe: ff, gg, ll, mm, nn, pp, rr, tt;
des consonnes le plus souvent muettes en fin de mot, souvent requise pour leur fonction grammaticale ou pour des raisons étymologiques: d (en fin de mot), lt (après au, eau), p (muet après a, o), s, t (sauf après e), x (muet après au, eau, eu); ces consonnes sont souvent mutables pour former les accords (x devient s, f devient v);
des graphies semi-vocaliques:
une semi-voyelle formant des diphtongues: y (utilisée au lieu de ill après a pour former des diphtongues distinctes);
un trigramme semi-voyelle sécable, formant des diphtongues après un son voyelle, ou parfois isolément après une consonne: ill (forme préférée à y)
des graphies vocaliques:
une voyelle le plus souvent muette en fin de mot, souvent requise pour sa fonction grammaticale ou lexicographique: e (normalement toujours muette après é, i, u, sauf en cas de formule emphatique accentuant exagérément le féminin; son ajout après une consonne finale provoque la mutation cette consonne, muette ou non, en une autre consonne non muette, ou parfois en digramme consonantal sécable).
de nombreux digrammes ou trigrammes vocaliques (subissant parfois des mutations orthographiques et souvent phonétiques) issus d'anciennes diphtongues, ou d'une réforme de l'écriture de la nasalisation (après la disparition du tilde diacritique):
ai, aî, ain, aie, an (mutable en am avant les consonnes b, p, m), au, ay,
ee (dans des mots importés de l'anglais), ef (dans le mot clef), ei, ein, en (mutable en em avant les consonnes b, p, m), er (en fin de verbe), et (en fin de mot), eu, ez (en fin de mot ou de verbe conjugué),
in (mutable en im avant les consonnes b, p, m),
on (mutable en om avant les consonnes b, p, m), oo (dans des mots importés de l'anglais), ou, œu
un (mutable en um avant les consonnes b, p, m);
des digrammes ou trigrammes de fausses diphtongues: oi, oî, oy, oin (sauf avant une voyelle).
Quelques remarques typographiques pour les caractères non alphabétiques:
le tiret cadratin (ou tiret long) «—» est principalement utilisé pour introduire des dialogues et pour encadrer des propositions;
le tiret demi-cadratin (ou tiret moyen ou demi-tiret) «–» est essentiellement utilisé pour les énumérations;
le tiret quart de cadratin (ou tiret court) «-» est utilisé en trait d'union, comme signe négatif dans les nombres et signe de la soustraction, pour signaler un intervalle,etc.
le tilde au-dessus du n est parfois utilisé pour les mots d'origine espagnole s'écrivant avec la lettre ñ (cañon, El Niño). La prononciation est alors gn ou ny;
le tréma sur le a est utilisé pour le mot pluriel allemand Länder;
les imprimeurs du XVeauXVIIesiècle ont utilisé certaines abréviations aujourd'hui désuètes.
Pour donner à l'écriture du français une plus grande transparence orthographique, des propositions de modifications de l'alphabet français ont été faites au XIXesiècle comme celle d'Adrien-Benjamin Féline.