PDF : les logiciels indispensables et gratuits

PDF : les logiciels indispensables et gratuits

Introduction

Mise en page figée, polices intégrées, textes dynamiques, annotations, signatures, travail collaboratif : le PDF est aujourd'hui si répandu qu'il est impossible de ne pas y avoir été confronté au moins une fois dans sa vie. Pourtant, malgré sa popularité et sa normalisation en 2008, il n'est pas toujours évident de dénicher les bons outils gratuits pour le lire, le manipuler, le numériser.

Si le PDF connaît aujourd'hui un succès planétaire, il n'en a pas toujours été ainsi. Pour comprendre comment ce format propriétaire s'est mué en standard incontournable, il faut remonter au début des années 1970.

De la modélisation du port de New York...

À l'époque, la société Evans and Sutherland (E&S) domine le marché de l'infographie. Bien qu'installée à Salt Lake City, elle dispose d'un petit laboratoire de recherche à Mountain View, dirigé par John Warnock. Chargé de développer un interpréteur de bases de données infographiques 3D du port de New York pour le terminal CAD/CAM Picture System et différents générateurs d'images de simulation E&S, il embauche John Gaffney. En 1975, Gaffney présente la première version documentée d'un nouveau langage interprète basé sur Forth : The Evans and Sutherland Design System.

En 1978, Warnock quitte E&S et intègre le Laboratoire des Sciences de l'Imagerie du Xerox PARC. Sous la direction de Chuck Geschke, il fait équipe avec Martin Newell et s'inspire du Design System de Gaffney pour créer JaM (« John and Martin »), langage de description de page également basé sur Forth. Durant cette même période, les chercheurs du PARC ont successivement sorti les imprimantes XGP, EARS et Dover. Or, chaque imprimante faisant appel à son propre interpréteur, il n'a pas fallu longtemps pour comprendre qu'un standard de description de page devait être mis au point.

À partir de ce constat, JaM a évolué en Press sous la direction de Bob Sproull et William Newman. Il s'agissait d'un format plutôt que d'un langage, indépendant des modèles d'imprimantes sur lesquelles il opérait. Son manque de flexibilité et les nombreux défauts dont il souffrait ont poussé Warnock et Geschke à retravailler JaM et Press. C'est ainsi qu'est né Interpress.

Hélas pour Warnock et Geschke, Xerox rechigne à commercialiser Interpress dont l'implémentation restera réservée à certaines imprimantes Xerox. Les deux informaticiens quittent le PARC en 1982 et co-fondent Adobe Systems.

... aux débuts de l'aperçu avant impression

À la tête de leur entreprise, Geschke et Warnock voient dans Adobe Systems l'opportunité d'une seconde chance pour Interpress. Ce dernier étant demeuré propriété de Xerox, ils travaillent à un nouveau langage de description de page baptisé PostScript. Cross-plateforme, il regroupe dans un fichier PS tous les éléments décrivant une page : texte, images, polices de caractères, etc.

D'un point de vue technique, PostScript a besoin d'un Raster Image Processor pour être lu par le pilote d'impression. Un RIP est un outil capable de tramer des données (ici celles contenues dans le fichier PS) pour les retranscrire dans des fichiers bitmap (images matricielles), et ainsi les rendre imprimables. Pour résumer, le RIP permet d'imprimer la représentation graphique des descriptions PostScript qu'il interprète.

Commercialisé pour la première fois en 1984, PostScript connaît un tournant décisif en 1985 avec la sortie de la LaserWriter. Pour rappel, cette imprimante vendue par Apple a largement contribué au développement de la publication assistée par ordinateur. Intégrant nativement un interpréteur PostScript et compatible avec PageMaker (créé par Aldus, racheté par Adobe, progressivement remplacé par InDesign), la LaserWriter offrait au grand public la possibilité d'imprimer des compositions graphiques telles que représentées à l'écran (WYSIWYG). Grand moment dans l'histoire de la PAO.

Mais PostScript éprouve ses limites, toutes liées de près ou de loin à l'utilisation d'un RIP. En tant que langage, PostScript peut décrire une même page de plusieurs manières. À cette imprévisibilité s'ajoute le besoin de connaître les caractéristiques du dispositif d'impression utilisé, ainsi que les difficultés d'interprétation liées aux RIP. Deux RIP PostScript n'interprèteront pas forcément une même description PostScript de la même manière.

Autre défaut : la rastérisation abaisse considérablement la qualité des images à l'impression. Pour pallier ce problème, Adobe développe le format EPS (Encapsulated PostScript), permettant de conserver les caractéristiques vectorielles d'un document et donc d'imprimer des images de haute qualité, aux contours nets. Par ailleurs, les fichiers EPS encapsulant leur propre prévisualisation, ils permettent aux applications dénuées d'interpréteur PostScript d'afficher à l'écran une représentation graphique basse résolution de la description PS avant impression. Un format autonome qui prépare le terrain du PDF.

Naissance du PDF : porter PostScript à l'écran

S'il est aujourd'hui commun d'affirmer que le PDF remplace PostScript, il s'agit d'un abus de langage. En réalité, le PDF est une évolution du format EPS. À l'instar de son prédécesseur, il est bâti sur PostScript et contient la prévisualisation de sa représentation graphique. Mieux encore, il contient sa représentation graphique déjà retranscrite par un RIP PostScript...

Lire la suite