Techniques de polices de caractères : présentation rapide

Différents types de polices

Il existe deux manières de représenter des caractères à l'écran et dans les imprimantes : bitmap et vectoriel. « bitmap » signifie en anglais « tableau de points ». Cette distinction entre bitmap et vectoriel existe en fait pour tout dessin informatique en général, pas seulement pour le dessin de caractères. Les seuls avantages des polices bitmap, historiquement les plus anciennes, est qu'elles sont très légères et rapides à gérer pour le matériel informatique et éventuellement plus précises pour les très petites tailles.

Les améliorations apportées par l'intelligence des polices vectorielles sont indispensables pour un vrai travail de qualité : possibilité de faire varier la taille, la résolution ou la forme des caractères sans perte de qualité, amélioration de l'aspect en fonction de la taille, gestion des ligatures et formes contextuelles, crénage et autres gestion des espacements, etc.

Pour ne pas simplifier, on rencontre couramment au moins deux types de polices vectorielles :

TrueType

Les polices vectorielles conçues selon la norme TrueType, sont principalement utilisées pour l'affichage sur écran dans les systèmes Windows et MacOS. Cette norme est issue d'un travail d'Apple qui voulait s'affranchir de la dépendance de la technique équivalente PostScript d'Adobe. Microsoft a très vite adhéré à TrueType pour la même raison. Cette norme a abouti sur MacOS en 1991. Ce sont ces types de polices que l'on rencontre le plus couramment dans les environnements MacOS et Windows, car les programmes permettant leur affichage sont directement intégrés dans ces systèmes.

PostScript

Le langage PostScript est un langage complet (« Le » langage ?) de description de page ou encore de composition graphique, et pas seulement de dessin de caractères. Il est conçu au départ pour décrire précisément un produit imprimé final, mais il est possible de le visualiser à l'écran. Le langage PostScript est d'une très grande richesse, permettant de « dessiner » des choses très élaborées avec des instructions très abstraites. On peut le considérer comme le remplaçant informatique des instructions en langue naturelle, qu'un maquettiste donnait il y a 50 ans à un imprimeur. Il a été créé dans les années 1980 par la firme Adobe et s'est imposé vers 1985 comme standard sous l'impulsion du tandem Apple-Adobe et des imprimantes LaserWriter.

Ce langage comprend naturellement une partie dédiée à la description des polices vectorielles. C'est ici seulement cette partie « polices » du langage qui nous intéresse. Les polices conçues avec ce langage sont naturellement appelées polices PostScript

On notera que l'affichage de ces caractères sur un écran nécessitent des ressources informatiques légèrement plus importantes que les polices TrueType, et que les programmes permettant cela ne sont pas intégrés par défaut dans les versions actuelles de Windows et MacOS. Par contre, les imprimantes Postcript sont très répandues (en général toutes les lasers sauf les lasers bas de gamme comprennent le PostScript), car pour l'impression, les besoins en qualité reprennent le dessus sur les besoins en rapidité.

Ces brèves explications techniques simplistes ignorent volontairement les batailles commerciales entre TrueType et PostScript, qui sont aussi pour beaucoup (voire même plus que les aspects techniques) dans l'adoption de l'une ou l'autre de ces normes. On peut partir de ce lien (en anglais) : http://www.truetype.demon.co.uk/ pour en savoir beaucoup plus sur l'histoire passée et future de ces deux technologies.

ATM
L'affichage à l'écran des polices PostScript avec Windows ou MacOS nécessite un programme complémentaire, qui n'est lui pas systématiquement intégré dans le système comme c'est le cas pour TrueType. Ce programme s'appelle ATM (Adobe Type Manager, c.-à-d. gestionnaire de polices Adobe). Ce programme permet également l' impression de polices PostScript sur des imprimantes non PostScript.
ATM pour MacOS
Il est très simple de se procurer ce programme pour MacOS : sa version "ATM Lite" (c.-à-d. minimale) est automatiquement installée lors de l'installation du programme Acrobat Reader, qu'on trouve à peu près partout. La source officielle est ici : http://www.adobe.fr il est sur la plupart des CD-ROM d'accès « gratuit » à internet et ceux accompagnant les revues informatiques. Et même encore plus simple : sur les CD-ROM systèmes MacOS récents. Les versions à jour en janvier 1998 sont Acrobat Reader 3.01 et ATM 4.02
Il faut de plus savoir que ce programme n'est même pas réellement indispensable avec MacOS si on dispose d'une imprimante Postscript, ce qui est le cas de toutes les imprimantes laser pour Macintosh. En effet, une imprimante PostScript n'a nul besoin d'une aide pour imprimer parfaitement des polices PostScript. Utiliser dans ce cas des polices PostScript sans le programme ATM est possible, donnera un affichage écran bitmap de mauvaise qualité mais lisible, et une impression parfaite.
ATM pour Windows
Malheureusement, se procurer ce programme pour Windows est beaucoup plus difficile, alors qu'il est pourtant plus nécessaire que sur un Mac ! En effet, la version Windows d'Acrobat Reader inclut elle ATM étroitement en son sein, et nefait contrairement à MacOS aucunement profiter tout le système et donc tous les programmes de sa capacité à afficher et imprimer des polices Postscript. Cependant, d'autres programmes d'Adobe, mais ceux-ci payants, sont livrés avec une version indépendante d'ATM Lite. On notera qu'il est possible également en dernier recours de télécharger du site d'Adobe (http://www.adobe.com) une version limitée à la démonstration du programme PageMaker (poids = 17Mo !), qui contient enfin une version indépendante et non limitée d'ATM Lite.

À vrai dire, la politique d'Adobe concernant ce programme ATM Lite est volontairement très floue, dans le sens où il est difficile de déterminer les droits d'utilisation et de distribution de ce programme. Sur les sites d'Adobe, il n'est question que de la version ATM Deluxe, elle bien sûr commerciale, et il est impossible de trouver la moindre information à propos d'ATM Lite.

On trouvera un comparatif entre ATM Lite et ATM Deluxe dans la note technique 316048 d'Adobe.

Encodage

Dessiner une police de caractères n'est pas suffisant, il faut ensuite l'indexer. Les machines ne travaillant qu'avec des nombres, il faut donner à chaque caractère un numéro unique permettant de le référencer. On appelle cette table de correspondance entre numéros et caractères « vecteur d'encodage ». Cette table s'appelle dans l'univers Windows « codepage » ou « page de codes ». On comprend vite qu'il y a tout intérêt à ce que les différents systèmes informatiques utilisent la même numérotation, afin d'éviter de pénibles procédures de traduction lorsqu'on passe de l'un à l'autre. Ou tout au moins, si le lourd héritage du passé fait qu'il est impossible d'uniformiser les coutumes locales, il est intéressant de s'entendre sur un nombre restreint d'encodages « esperanto » de communication servant à simplifier les échanges entre différents systèmes, et normalisés internationalement pour plus de sûreté.

Concernant les caractères latins sans diacritiques (accents,...), presque tous les systèmes utilisent désormais l'encodage défini dans la norme ASCII , qui utilise les numéros de 0 à 127. Pour les langues d'Europe occidentale, on le complète avec la norme ISO 8859-1 ou ISO latin-1 , énormément utilisée sur le web et dans le courrier électronique. Elle définit en plus des caractères numérotés de 160 à 255. Cette norme présentant certains défauts, comme le manque du caractère euro, 8 caractères ont été remplacés, et on obtient alors la norme ISO 8859-15 ou ISO latin-9 . L'euro se trouve dans ce nouvel encodage à la place numéro 164, à la place du caractère « monnaie internationale », inutilisé. On trouvera tous les détails sur cette norme et d'autres encore dans l'excellente note de Jacques André « ISO-latin9, euro et typographie française », accessible sur la page euro de Bertrand Decouty , qui traite différemment le même sujet que ce site.

Actuellement, la plupart des systèmes informatiques utilisent encore un encodage limité à 256 caractères. Mais la plupart ont prévu dans leur évolution d'utiliser un encodage permettant de représenter au minimum 65536 caractères différents, et miracle, d'utiliser tous le même ! Cet encodage s'appelle unicode . Sur le site web de l'organisme unicode http://www.unicode.org/ une section concerne plus spécifiquement l'euro : http://www.unicode.org/unicode/reports/tr8/#Euro Sign .

Le très complet site de Roman Czyborra (en anglais) contient de nombreuses informations à propos d'ASCII, de ses compléments ISO 8859-x, d'unicode, des encodages asiatiques, etc.


v 0.9 Retour à la page de base

© Marc Herbert - marc.herbert@free.fr - Ces documents peuvent être librement reproduits à condition de l'être dans leur intégralité et sans modifications d'ancune sorte.