Loading AI tools
De Wikipédia, l'encyclopédie libre
En typographie et en orthographe, la coupure de mot, parfois appelée aussi césure, est l'opération qui consiste à couper par un trait d'union conditionnel en fin de ligne un mot qui n’entrerait pas dans la justification. Cette coupure obéit à des règles bien précises qui varient d'une langue à l'autre. La plupart des logiciels de traitement de texte et de mise en page comportent un tel programme de césure.
La marque de cette césure est le trait d'union, que l’on place en fin de ligne mais jamais au début. Par exemple :
Dans le cas d’une justification à droite et à gauche du texte, le trait d'union inséré à la position de coupure d’un mot apparaît dans la largeur de la colonne de texte, mais jamais en marge.
De même on ne sépare aucune des ponctuations attachées au mot (la coupure se fait après l’espace qui les sépare du mot suivant, cette espace étant alors réduite à une largeur nulle en cas de justification à droite et à gauche de la ligne). La coupure sur ces espaces ne fait apparaître aucune coupure de mot, donc aucun trait d'union n’est nécessaire.
Le trait d'union préserve le style et la graisse des caractères du mot orthographié ; il sera donc gras ou léger, droit ou italique, souligné, biffé, surligné, et dans les mêmes couleurs que les caractères du mot où il est inséré.
D’une façon générale, on ne coupe jamais en ne laissant qu’un seul caractère du mot en début ou fin de ligne, car le trait d'union ajouté ne le justifierait pas. Si on ne peut couper ailleurs, le mot entier sera renvoyé à la ligne. Fréquemment, les règles typographiques imposent des longueurs minimales de coupure plus élevées (consulter les exemples ci-dessous), à moins que la colonne de texte soit si étroite qu’il est impossible d’y faire tenir le mot entier.
La séquence de césure s'effectue selon le découpage syllabique, en essayant si possible de couper entre préfixes et radicaux. Les règles de césures ne seront donc pas les mêmes en castillan, par exemple, dont la syllabation suit d’autres contraintes.
On ne coupe jamais à la position d’une apostrophe (même si elle apparaît à la jonction de deux mots), car elle marque aussi l’élision partielle de la fin d’un premier mot dont les dernières lettres participent avec les premières lettres du mot suivant à la même syllabe prononcée.
Dans certains cas, elle apparaît même dans l’élision interne au milieu d’un même mot, ou lorsque ce sont les premières lettres du mot suivant qui ont été élidées. Et là aussi, la coupure est proscrite.
En catalan, le point médian (·) joue le rôle d’un tiret de césure faible visible et celui d’un signe diacritique. Il apparaît au milieu des mots même non coupés, notamment entre deux 'l' prononcés de façon géminée, et marquant aussi la position d’une séparation syllabique, quand il est nécessaire de le distinguer du cas du trigramme ill prononcé dans une diphtongue (comme en français) ou digramme ll marquant un l palatal, qui est écrit sans point médian.
Ce point médian joue le rôle d’un signe diacritique pour le premier l du doublet l·l, et est souvent indenté horizontalement dans le cas du doublet L·L afin de préserver l’écartement typographique standard entre les deux L majuscules (ce qui fait clairement apparaître son caractère de signe diacritique modifiant la première lettre du doublet, et lui confère son caractère orthographique).
Quand un point médian (orthographique) est présent au milieu d’un mot, marquant clairement une séparation syllabique, et si la coupure peut avoir lieu, on le remplacera par un trait de césure; dans ce cas-ci, on doit toujours éliminer le point médian. En revanche, entre deux l non précédé d’un i, on a toujours une gémination, et la position de césure possible n’est jamais marquée orthographiquement et se fera de la façon usuelle. Ainsi avec le mot col·laboració :
Pour ces raisons le point médian ne peut jamais être utilisé en catalan comme signe de ponctuation séparant deux mots, sans l’encadrer d’une espace de chaque côté (dont la première devrait être insécable au contraire de la seconde). Cette règle typographique devrait aussi être observée en français et dans les autres langues[réf. souhaitée].
Il existe en français au moins un mot (plus exactement, deux homographes) qui doit être coupé différemment selon son sens ou sa nature grammaticale : « malaise » se coupe en mal-aise s’il s’agit du nom masculin qui désigne un état de désagrément ou de gêne passagère, mais en ma-laise s’il s’agit du nom féminin (gentilé) ou de l’adjectif relatif à la Malaisie.
L’eszett en allemand (lettre minuscule unique issue de la ligature d'un s long et d’un second s normal) se coupe en s-s. Cela a mis en échec plusieurs exits de traitements de texte vers des programmes de coupure externes (add-ons). Les interfaces ne prévoyaient nullement qu’on pût leur rendre plus de signes après la coupure (hormis le trait d'union) ![réf. souhaitée]
Il en existe aussi une version en tant que lettre capitale, qui se coupe en S-S par exemple lorsqu'il apparaît au milieu d'un long mot écrit en capitales. Le débat sur la forme à adopter pour cette ligature majuscule n’a abouti que récemment (depuis son codage informatique).
L’eszett possède d’autres interprétations dans d’autres langues d’Europe centrale comme le hongrois, où il représente une ligature les lettres sz (ou SZ pour la ligature majuscule). Si la langue ne peut être déterminée, l’eszett ne pourra pas être coupé de façon valide avec certitude.
D’autres ligatures minuscules ou majuscules (dont certaines autres fondées sur le s long) existent aussi, mais elles sont typographiques uniquement et peuvent toujours se décomposer dans leurs composants. (Ces ligatures peuvent être produites automatiquement par les moteurs de composition de page, et les règles relatives à leur césure autorisée ou non peuvent aussi être contrôlées dans les logiciels aussi de la même façon que dans le cas des autres digrammes ou trigrammes).
Dans les exemples ci-dessous, le tiret court (-) indique la césure autorisée, la barre oblique (/) indique la césure interdite ; les positions de césures autorisées mais non recommandées sont indiquées par le signe deux-points (:).
Dans les mots composés utilisant déjà un trait d’union, la seule coupe possible est au trait d'union lui-même, sans insérer de trait d'union supplémentaire :
Dans les composés avec un tiret demi-cadratin mais sans traits d’union, la coupe est possible après ce tiret demi-cadratin, sans insérer de trait d’union supplémentaire :
Quand traits d’union et tirets demi-cadratins sont présents ensemble, la coupure n’est possible qu'après ces caractères, sans insérer de tiret supplémentaire (et préférablement après un tiret demi-cadratin avant tout autre trait d’union) :
La césure relève de certaines règles afin d’éviter des césures malheureuses.
Pour les mots dérivés à affixes, on songera d’abord à effectuer la césure à la jonction du lexème des affixes en question :
On évite de laisser deux lettres -pe en début de ligne, et si possible de couper le préfixe proto- (mais ce n’est pas interdit). On évite aussi de ne laisser que deux caractères en début ou fin de ligne :
On évite la formation du mot que en début de ligne :
On évite in- ou ru- réduits à deux lettres en fin de ligne, ainsi que con- tout seul en fin de ligne et surtout en début de ligne :
On évite cul- ainsi que deux lettres, re en début de ligne :
On évite absolument fac- en début de ligne ; mieux vaut facul-té que fa-culté
Il est recommandé en outre d’éviter d'effectuer plus de trois césures successives (cette règle n’est pas stricte, dans des colonnes étroites de texte justifiées à droite et à gauche, il est parfois difficile de faire autrement sans produire des espacements entre mots ou entre caractères, trop grands pour être facilement lisibles sur la même ligne ou trop petits pour faire apparaître clairement les espaces de séparation entre les mots).
La plupart des logiciels de traitement de texte et de mise en pages comportent un programme de césure automatique s'adaptant à la langue du texte. Cependant, en l’absence d’un tel logiciel, les coupures automatiques seront totalement évitées sauf si la langue ou l’écriture l’y autorise.
Le caractère Unicode U+00AD est un trait d'union conditionnel permettant d'indiquer l'emplacement d'une césure possible dans un mot. En HTML ou SGML, ce caractère peut être indiqué par l’entité de caractère
. Le nom shy est un acronyme pour soft hyphen en anglais ; c'est aussi un rétro-acronyme, puisque shy signifie « timide ». Or, le trait d'union « conditionnel » peut être nommé discretionary hyphen, « trait d'union discrétionnaire », qui évoque discret. C'est le trait d'union discret, qui se cache.
De façon générale :
Dans le cas de l’eszett allemand :
Des caractères ligaturés sont utilisés dans d’anciennes transcriptions en alphabet phonétique international (API), où le même caractère codant le eszett allemand était utilisé mais en tant que caractère ayant valeur de symbole unique. La norme API actuelle a rendu ces ligatures obsolète, et privilégie l’écriture des symboles séparés, et liés par un tirant long suscrit (considéré comme un signe diacritique « double », encodé en Unicode juste avant le second caractère de base). L’API possède un symbole qui ressemble à un eszett, mais il est toujours insécable et codé différemment : il s’agit en fait de la lettre latine bêta minuscule (distincte aussi de la lettre grecque dans les textes encodés avec Unicode).
Jacques André, « Petites leçons de typographie » [PDF], (consulté le ), p. 52
Lexique des règles typographiques en usage à l’Imprimerie nationale, France, 6e, (réimpr. 2007, 2008, 2011), 196 p., broché (ISBN 978-2-7433-0482-9)
Outil en ligne pour déterminer les césures en français
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.