divers:informatique:formats [La page à Emache]

A propos de formats de fichiers

Fichiers texte

Qu'est-ce qu'un fichier texte ? Simplement une suite de caractères visible sur l'écran, imprimables, et compréhensibles par l'ordinateur. Malheureusement, le mot “simplement” est de toute évidence abusif et trop optimiste.

ASCII
La première tentative de normalisation a été dans ce domaine la définition du code ASCII, qui associe de manière immuable et internationale un code binaire particulier à un caractère donné (lettre, chiffre, ponctuation).
Là où le bât blesse, c'est que ce code a été défini pour la langue anglaise, qui n'utilise aucun accent. Le code ASCII de base utilise moins de 128 caractères, ce qui permet de le coder sur 7 bits. Tous les caractères au-delà de 128 ont été laissés à la discrétion des fabricants de machines, qui ont défini leur propre correspondance, sans bien entendu s'occuper des choix des voisins. S'en est suivi un peu plus d'incompatibilité.
Heureusement, les normes successives ISO-LATIN, UTF8, etc… ont apporté une solution. Un fichier codé selon cette norme sera lu par n'importe quelle machine et retrasncrit correctement. A noter que si la norme est unique, le transcodage visant à produire ce résultat unique dépend là encore de la machine utilisée.

RTF et RTFD
Bon, me direz-vous, il suffit de coder tout fichier texte en utilisant une des normes ci-dessus, et le tour est joué ! Pas exactement, et loin s'en faut. Nous n'avons jusqu'ici parlé que de simple fichier texte, dépendant uniquement de la machine utilisée. Si nous passons au niveau suivant, là où pour écrire un article ou un livre nous avons besoin de “formater” le texte, c'est à dire de faire de la typographie (gras, italique, tableaux, couleurs, etc…) il nous faut comprendre que cette fois c'est le logiciel de traitement de texte utilisé qui va utiliser ses propres conventions, et bien entendu, chaque éditeur de logiciel utilise ses propres conventions de codage pour la partie “typographie”.
Celà veut dire, pour ne parler que d'un simple exemple, que si tel logiciel code le gras d'une certaine manière, il est probable que le logiciel de votre correspondant sera incapable de décoder correctement et d'afficher le gras. Et ce processus s'étend à toute la typographie, ce qui va jusqu'à une impossibilité d'ouvrir un fichier avec le logiciel A s'il a été fabriqué avec le logiciel B. Pour pouvoir s'affranchir de ce nouveau problème, il existe, mais vous l'avez deviné, un codage supplémentaire, plus complet, appelé RTF, de Rich Text Format, qui fournit un moyen “universel” de conversion de texte enrichi.
Ainsi, tout traitement de textes non simplement ASCII digne de ce nom pourra ouvrir une fichier provenant de n'importe quelle source, pourvu qu'il ait été enregistré au format RTF. Ce format est d'autant plus utile que certains éditeurs, non contents d'avoir choisi leur codage personnel comme référence, font en sorte que toute ancienne version de leur logiciel ne puisse pas lire les fichiers créés avec toute version postérieure, ce qui semble un comble, mais se trouve être la manière la plus efficace de forcer les utilisateurs à acheter les mises à jour de logiciels !
RTFD, quant à lui, offre la possibilité supplémentaire de fournir les images avec le texte codé.

En résumé Pour envoyer un fichier texte à un correspondant, utiliser le format ASCII (souvent appelé “texte seul”) à chaque fois que celà vous est possible. S'il vous est indispensable de partager aussi la typographie (mise en page, tableaux, etc…), assurez-vous de sauvegarder votre fichier au format RTF. De la sorte, vous limiterez au strict minimum les problèmes de lecture que votre correspondant pourrait rencontrer.

PDF
Ce format de fichier, mis au point par un éditeur connu, est actuellement en passe de prévaloir, tant par ses possibilités d'afficher aussi bien du texte mis en forme que des graphismes, que par le fait qu'on trouve un outil de lecture et d'impression gratuit pour pratiquement tous les systèmes d'exploitation actuels. S'il arrive après les autres formats dans notre liste, c'est simplement qu'il qu'il est apparu après les autres formats fichier. PDF semble être le format idéal pour la publication de tous documents directement téléchargeables dès lors qu'il n'est pas envisagé de modification directe. Ce format présente en outre un avantage indéniable : Quelle que soit le système d'exploitation, la mise en page restera identique à l'original, ce qui est loin d'être le cas des formats propriétaires…

Fichiers tableurs : SYLK

Le problèmes sont pratiquement du même niveau en ce qui concerne les tableurs. Chaque éditeur, outre les codages courants de typographie, ont leur codage particulier pour les formules et tout ce qui est particulier à un logiciel tableur. Là encore, Monsieur Normalisateur est passé par là, et nous a offert un format de fichier qui permet de nous affranchir des particularités de tel ou tel éditeur. Il s'agit du format SYLK, qui est aux tableurs ce que le format RTF est aux traitements de texte. Envoyez donc vos fichier tableurs à vos correspondants en utilisant ce format, et vous diminuerez énormément la horde des mécontents.

Fichiers images

Une place importante est maintenant occupée par les images dans le monde de l'ordinateur. Bien entendu (qui en eût douté ???) les problèmes de compatibilités se posent également. On distingue deux principaux types de fichiers image: Les fichiers “bitmap” ou “carte de points” (cette traduction littérale est ici juste une meilleure compréhension), et les fichier de type “vectoriel”.

Bitmap
Une image de type “bitmap” décrit en fait chaque point de l'image avec un nombre définissant la couleur du point. Quand on parle d'une image “16 bits”, par exemple, cela signifie que chaque point sera défini par une valeur hexadécimale entre 0000 et FFFF, soit entre les valeur décimale 0 et 65535. Et cela devra être répété pour chaque point de l'image. Heureusement, l'ordinateur fait celà très vite et très bien.
Les fichiers bitmap les plus “universels” sont le format TIFF, décrivant à l'origine strictement chaque point de l'image, puis incluant, plus tard, une “compression” visant à diminuer la taille du fichier. Le format tiff est l'un des meilleurs quant à la conservtion des qualités de l'image.
Plus tard dans l'histoire est apparu le format GIF (Graphic Interchange Format), fournissant des images de bonne qualité, mais compressées. A noter (et celà est important pour un site web) qu'il est possible dans une image au format GIF, de rendre transparente une des couleurs du fichier.
Un autre format a été introduit plus tard, principalement pour les besoins de la presse écrite, il s'agit de JPEG. Les algorithmes de compressions plus puissants, associés à une dégradation mesurée, et pratiquement invisible à l'oeil, de l'image, permettent à un image JPEG de rester parfaitement correcte pour un “poids” 10 à 20 fois inférieur à celui d'une image bitmap non compressée. Ce format est parfaitement adapté aux pages web, qui sont destinées avant tout à être vues sur un écran d'ordinateur, à faible définition (72 DPI).
Une fois de plus, tous les formats “propriétaires” sont à bannir, car ils ne peuvent être ouverts que par les ordinateurs adaptés. TIFF, GIF et JPEG sont des formats parfaitement adaptés aux échanges entre machines de différentes marques et les deux derniers sont les plus usités pour la publication sur le web.

Vectoriel
Un fichier graphique de type “vectoriel” est totalement différent d'un fichier bitmap, en ce sens qu'il est décrit comme une ensemble de vecteurs ou de courbes de bézier. Ainsi, un segment de droite sera décrit par les coordonnées de son origine, les coordonnées de son extrémité, et sa couleur. De ce fait, même une ligne droite de 200 pixels, qui aurait nécessité 200 valeur différentes pour être décrite au format bitmap, ne nécessite que quelques octets pour être parfaitement définie. Les courbes de Bézier utilisent un processus similaire, bien qu'un peu plus compliqué. Etant donné qu'il s'agit d'une courbe, à chaque changement de direction correspondront deux vecteurs définis par leur origine, leur direction et leur longueur. Nous n'irons pas plus avant en ce qui concerne la structure du format vectoriel. Une fois de plus, les fichiers inter-plateformes sont de rigueur. A noter l'apparition relativement récente du format svg, qui présente l'avantage d'être un format open source, et de pouvoir être publié sur une page web,et donc visible directement dans votre navigateur.

Fichiers son

MIDI
Comme pour les autres types de fichiers, les constructeurs ont défini leurs propre normes pour les fichiers son. La norme MIDI a été définie en vue du pilotage d'instruments de musique (synthétiseurs, batterie électronique, etc..) par des micro-ordinateurs. Un peu à l'image du format vectoriel en dessin, la norme MIDI permet de retranscrire en un langage interprétable par n'importe quel ordinateur tous les éléments nécessaires à la description d'un morceau de musique, avec le tempo, les nuances, les différents instruments, etc… C'est de loin le langage de description musicale le plus élaboré à ce jour, permettant de traduire tout ce qui est jouable dans un orchestre.

  • Avantage : chaque note est décrite individuellement, et peut être modifiée avec un simple (à utiliser) éditeur MIDI (appelé séquenceur).
  • Inconvénient : Ce format nécessite un synthétiseur connecté à votre ordinateur, ou un synthétiseur virtuel (software) installé sur votre machine.

AIFF et Wav
AIFF et Wav sont un peu le “bitmap” des fichiers son. L'idée de ce type de codage est plus orientée vers le “nuage de points” interprété par l'ordinateur. Aucune possibilité d'éditer une note ou même un instrument particulier, mais il est possible d'éditer un tel fichier avec un éditeur spécifique, et de modifier le fichier par “copier-coller” d'une ou plusieurs séquence(s) particulière(s).
Ces format sont utilisés le plus souvent pour des sons enregistrés directement sur ordinateur. Il existe des convertisseurs permettant de passer d'un format à l'autre, ce qui rend accessibles vos fichiers son à tous types de micro-ordinateur.

MP3
Un nouveau format, apparu depuis bon nombre d'années, appelé MP3, est devenu quasiment le standard des fichie'r sons compressés. Il autorise un codage compressé de fichiers son, permettant une diminution de taille appréciable. AIFF et WAV se prètent parfaitement à la publication sur le web, mais la taille des fichiers produits est prohibitive. Il est évident que MIDI et MP3 sont incomparables quant à la taille des fichiers résultants. MIDI reste le mieux adapté pour l'échange entre ordinateurs, l'édition et le pilotage d'instruments de musique électronique.

OGG
Apparu plus récemment, le format OGG, open source contrairement à MP3 qui est “propriétaire”, offre un meilleur taux de compression que MP3, pour une qualité supérieure. Les fabriquants demeurent cependant réticents à fabriquer des lecteurs compatibles…

Pour vous donner un ordre d'idées, 40 secondes de musique “pèseront”

  • 7 Mo au format AIFF ou Wav
  • 650 Ko au format MP3
  • 550 Ko au format OGG
  • 5 Ko au format MIDI
divers/informatique/formats.txt · Dernière modification: 2018/06/12 23:35 (modification externe)