Lilapuce
 

exercices (samedi 2 février 2013)

Taille de fichier texte

Ce support fait suite à l’explication donnée sur l’enregistrement d’un texte dans différents formats de fichiers.

Le but du jeu consiste, à présent, à montrer à quoi correspond la taille d’un fichier texte, compte tenu du nombre de caractères.

Prenons ce document (disponible en fichier joint) :

Il s’agit d’un fichier enregistré au format ODT.

Quand je double-clique sur cette icône, l’éditeur associé à ce type de fichier – sur mon ordinateur – éditera alors directement le document (si vous n’avez pas encore installé LibreOffice sur votre ordinateur, je vous recommande de vous le procurer).

D’un premier coup d’œil, en observant la barre d’état du programme, il est possible de connaître le volume général de ce document : 6 pages.

Ceci représente déjà une première indication, mais c’est très imprécis. La taille et la police du texte, les marges des pages ainsi que les espaces entre les paragraphes, sont des paramètres qui peuvent être modifiés et, en fonction de ces réglages, le nombre de pages d’un même texte est variable.

Le seul moyen de connaître précisément le volume d’un texte (on utilise le terme « calibrer ») consiste à savoir le nombre de caractères qu’il comporte.

Pour cela, il faut passer par le menu « Outils/Statistiques » :

Et le programme indique le nombre précis de caractères : 26 120 (espaces compris).

Conservons ce chiffre de côté pour l’instant, nous y reviendrons plus loin.

Pour l’instant, après avoir fermé la boîte de dialogue « statistiques », revenons dans l’explorateur de fichier afin de faire un clic du bouton droit de la souris sur l’icône de ce document

Sur le menu contextuel, je clique ensuite (bouton gauche) sur l’option « Propriétés » :

Ceci nous fournit des indications complémentaires sur ce fichier, en particulier, le nombre précis d’octets : 42 212.

Je clique sur le bouton « OK » afin de fermer cette boîte de dialogue. Là encore, nous y reviendrons.

Accordons-nous un petit moment de réflexion.

Nous avions vu qu’il est possible d’enregistrer le même texte dans différents formats de fichier ; ce qui nous avait conduit à observer qu’il existe des différences de taille de fichier (ko) plus ou moins importante selon le type de document.

En particulier, nous avions constaté que format « texte brut » (TXT) était de loin le moins volumineux, car dans ce type de fichier, la seule chose qui est mémorisée correspond à l’encodage des caractères, sans aucune autre information : aucune option de mise en forme du texte (taille, police, couleur, espacement, etc.) pas plus que les options avancées disponibles sur un traitement de texte tel que LibreOffice (tableau, valeurs de tabulation, styles, numérotation automatique des pages, etc.).

Maintenant que nous connaissons précisément le nombre de caractère de ce texte, il serait intéressant de mettre en rapport cette information avec le poids du même fichier, enregistré au format TXT.

Ainsi, puisque ce type de fichier ne conserve que les données concernant l’encodage du caractère, il serait possible de savoir « combien pèse » chaque caractère en nombre d’octets.

J’ouvre à nouveau le document afin d’en créer une copie. Pour cela, la solution la plus simple consiste à utiliser la fonctionnalité « Enregistrer sous » :

Dans la boîte de dialogue, je clique ensuite sur le sélecteur de « Type de fichier »...

… et je sélectionne le format « Texte (txt) » :

J’enregistre ce nouveau fichier :

Ce qui provoque l’apparition d’une demande de confirmation.

Le logiciel indique qu’en enregistrant ce fichier au format texte (TXT) nous ne pourrons pas conserver toutes les options de présentations que permet le format par défaut de LibreOffice.

C’est justement le résultat souhaité, voilà pourquoi je confirme l’enregistrement au format TXT en cliquant sur « Conserver le format actuel » :

Après quoi je retourne dans l’explorateur de fichiers, afin de récupérer le nouveau fichier créé.

Nous avions observé, dans le précédent exercice, que l’application associée par défaut sur Windows pour éditer un fichier au format TXT est le bloc-notes.

Le but du jeu ne consiste pas, ici, à éditer ce texte, mais à renouveler la procédure d’accès aux propriétés du fichier.

Après avoir cliqué, depuis le menu contextuel, sur l’option « Propriétés », j’observe que le fichier « pèse » 26 169 octets.

Si je reprend le nombre de caractères de mon texte (26 120), je constate que cela correspond, à peu de chose près, au nombre d’octets, quand ce dernier est enregistré au format TXT.

Autrement-dit, chaque caractère est encodé sur (environ) 1 octet ; ce qui donne la possibilité d’utiliser un caractère disponible parmi 256 possibilités.

De même, la saisie d’un caractère représente, au minimum, 1 octet en espace de stockage sur le disque dur.

 

Document de travail