Techniques de polices de caractères : présentation rapide
Différents types de polices
Il existe deux manières de représenter des caractères à l'écran et dans les
imprimantes : bitmap et vectoriel. « bitmap » signifie en anglais « tableau de
points ». Cette distinction entre bitmap et vectoriel existe en fait pour tout
dessin informatique en général, pas seulement pour le dessin de caractères.
-
La représentation bitmap consiste à placer chaque lettre dans un rectangle, et
à donner les point de ce rectangle à encrer par opposition à ceux qui restent
blancs.
-
La représentation vectorielle est plus abstraite et élaborée, et utilise des
fonctions mathématiques géométriques (traits et courbes) pour décrire les
caractères. Ceci permet entre autres de faire des zooms sans perdre de qualité.
Par exemple pour mémoriser comment dessiner un « A », on enregistre qu'il faut
tirer un trait d'en bas à gauche jusqu'à en haut et au milieu, redescendre en
bas à droite et enfin dessiner un petit trait horizontal. Microsoft appelle
les polices vectorielles « contours » dans ses traductions françaises.
Les seuls avantages des polices bitmap, historiquement les plus anciennes,
est qu'elles sont très légères et rapides à gérer pour le matériel informatique
et éventuellement plus précises pour les très petites tailles.
Les améliorations apportées par l'intelligence des polices vectorielles sont
indispensables pour un vrai travail de qualité : possibilité de faire varier la
taille, la résolution ou la forme des caractères sans perte de qualité,
amélioration de l'aspect en fonction de la taille, gestion des ligatures et
formes contextuelles, crénage et autres gestion des espacements, etc.
Pour ne pas simplifier, on rencontre couramment au moins deux types de
polices vectorielles :
TrueType
Les polices vectorielles conçues selon la norme TrueType, sont
principalement utilisées pour l'affichage sur écran dans les systèmes Windows
et MacOS. Cette norme est issue d'un travail d'Apple qui voulait s'affranchir
de la dépendance de la technique équivalente PostScript d'Adobe. Microsoft a
très vite adhéré à TrueType pour la même raison. Cette norme a abouti sur MacOS
en 1991. Ce sont ces types de polices que l'on rencontre le plus couramment
dans les environnements MacOS et Windows, car les programmes permettant leur
affichage sont directement intégrés dans ces systèmes.
PostScript
Le langage PostScript est un langage complet (« Le » langage ?) de
description de page ou encore de composition graphique, et pas seulement de
dessin de caractères. Il est conçu au départ pour décrire précisément un
produit
imprimé
final, mais il est possible de le visualiser à l'écran. Le langage PostScript
est d'une très grande richesse, permettant de « dessiner » des choses très
élaborées avec des instructions très abstraites. On peut le considérer comme le
remplaçant informatique des instructions en langue naturelle, qu'un maquettiste
donnait il y a 50 ans à un imprimeur. Il a été créé dans les années 1980 par la
firme Adobe et s'est imposé vers 1985 comme standard sous l'impulsion du tandem
Apple-Adobe et des imprimantes LaserWriter.
Ce langage comprend naturellement une partie dédiée à la description des
polices vectorielles. C'est ici seulement cette partie « polices » du langage
qui nous intéresse. Les polices conçues avec ce langage sont naturellement
appelées
polices PostScript
On notera que l'affichage de ces caractères sur
un écran
nécessitent des ressources informatiques légèrement plus importantes que les
polices TrueType, et que les programmes permettant cela ne sont pas intégrés
par défaut dans les versions actuelles de Windows et MacOS. Par contre, les
imprimantes
Postcript sont très répandues (en général toutes les lasers sauf les lasers
bas de gamme comprennent le PostScript), car pour l'impression, les besoins en
qualité reprennent le dessus sur les besoins en rapidité.
Ces brèves explications techniques simplistes ignorent volontairement les
batailles commerciales entre TrueType et PostScript, qui sont aussi pour
beaucoup (voire même plus que les aspects techniques) dans l'adoption de l'une
ou l'autre de ces normes. On peut partir de ce lien (en anglais) :
http://www.truetype.demon.co.uk/
pour en savoir beaucoup plus sur l'histoire passée et future de ces deux
technologies.
ATM
L'affichage à l'écran des polices PostScript avec Windows ou MacOS nécessite
un programme complémentaire, qui n'est lui pas systématiquement intégré dans le
système comme c'est le cas pour TrueType. Ce programme s'appelle ATM (Adobe
Type Manager, c.-à-d. gestionnaire de polices Adobe). Ce programme permet
également l'
impression
de polices PostScript sur des imprimantes non PostScript.
ATM pour MacOS
Il est très simple de se procurer ce programme pour MacOS : sa version "ATM
Lite" (c.-à-d. minimale) est automatiquement installée lors de l'installation
du programme Acrobat Reader, qu'on trouve à peu près partout. La source
officielle est ici :
http://www.adobe.fr
il est sur la plupart des CD-ROM d'accès « gratuit » à internet et ceux
accompagnant les revues informatiques. Et même encore plus simple : sur les
CD-ROM systèmes MacOS récents. Les versions à jour en janvier 1998 sont Acrobat
Reader 3.01 et ATM 4.02
Il faut de plus savoir que ce programme n'est même pas réellement
indispensable avec MacOS si on dispose d'une imprimante Postscript, ce qui est
le cas de toutes les imprimantes laser pour Macintosh. En effet, une imprimante
PostScript n'a nul besoin d'une aide pour imprimer parfaitement des polices
PostScript. Utiliser dans ce cas des polices PostScript sans le programme ATM
est possible, donnera un affichage écran bitmap de mauvaise qualité mais
lisible, et une impression parfaite.
ATM pour Windows
Malheureusement, se procurer ce programme pour Windows est beaucoup plus
difficile, alors qu'il est pourtant plus nécessaire que sur un Mac ! En effet,
la version Windows d'Acrobat Reader inclut elle ATM étroitement en son sein, et
nefait contrairement à MacOS aucunement profiter tout le système et donc tous
les programmes de sa capacité à afficher et imprimer des polices Postscript.
Cependant, d'autres programmes d'Adobe, mais ceux-ci payants, sont livrés avec
une version indépendante d'ATM Lite. On notera qu'il est possible également en
dernier recours de télécharger du
site d'Adobe
(http://www.adobe.com) une version limitée à la démonstration du programme
PageMaker (poids = 17Mo !), qui contient enfin une version indépendante et non
limitée d'ATM Lite.
À vrai dire, la politique d'Adobe concernant ce programme ATM Lite est
volontairement très floue, dans le sens où il est difficile de déterminer les
droits d'utilisation et de distribution de ce programme. Sur les sites d'Adobe,
il n'est question que de la version ATM Deluxe, elle bien sûr commerciale, et
il est impossible de trouver la moindre information à propos d'ATM Lite.
On trouvera un comparatif entre ATM Lite et ATM Deluxe dans la
note
technique 316048 d'Adobe.
Encodage
Dessiner une police de caractères n'est pas suffisant, il faut ensuite
l'indexer. Les machines ne travaillant qu'avec des nombres, il faut donner à
chaque caractère un numéro unique permettant de le référencer. On appelle cette
table de correspondance entre numéros et caractères « vecteur d'encodage ».
Cette table s'appelle dans l'univers Windows « codepage » ou « page de codes ».
On comprend vite qu'il y a tout intérêt à ce que les différents systèmes
informatiques utilisent la même numérotation, afin d'éviter de pénibles
procédures de traduction lorsqu'on passe de l'un à l'autre. Ou tout au moins,
si le lourd héritage du passé fait qu'il est impossible d'uniformiser les
coutumes locales, il est intéressant de s'entendre sur un nombre restreint
d'encodages « esperanto » de communication servant à simplifier les échanges
entre différents systèmes, et normalisés internationalement pour plus de
sûreté.
Concernant les caractères latins sans diacritiques (accents,...), presque tous
les systèmes utilisent désormais l'encodage défini dans la norme
ASCII
, qui utilise les numéros de 0 à 127. Pour les langues d'Europe occidentale,
on le complète avec la norme
ISO 8859-1
ou
ISO latin-1
, énormément utilisée sur le web et dans le courrier électronique. Elle
définit en plus des caractères numérotés de 160 à 255. Cette norme présentant
certains défauts, comme le manque du caractère euro, 8 caractères ont été
remplacés, et on obtient alors la norme
ISO 8859-15
ou
ISO latin-9
. L'euro se trouve dans ce nouvel encodage à la place numéro 164, à la place du
caractère « monnaie internationale », inutilisé. On trouvera tous les détails
sur cette norme et d'autres encore dans l'excellente note de Jacques André
« ISO-latin9, euro et typographie française », accessible sur la
page euro de Bertrand Decouty
, qui traite différemment le même sujet que ce site.
Actuellement, la plupart des systèmes informatiques utilisent encore un encodage
limité à 256 caractères. Mais la plupart ont prévu dans leur évolution d'utiliser un
encodage permettant de représenter au minimum 65536 caractères différents,
et miracle, d'utiliser tous le même ! Cet encodage s'appelle
unicode
.
Sur le site web de l'organisme unicode
http://www.unicode.org/
une section concerne plus spécifiquement l'euro :
http://www.unicode.org/unicode/reports/tr8/#Euro Sign
.
Le très complet site de
Roman Czyborra (en anglais) contient de nombreuses
informations à propos d'ASCII, de ses compléments
ISO 8859-x, d'unicode, des encodages asiatiques, etc.
v 0.9 Retour à la page de base
© Marc Herbert -
marc.herbert@free.fr
- Ces documents peuvent être librement reproduits à condition de l'être dans leur intégralité et sans modifications d'ancune sorte.