Conclusion
Les problèmes d’encodage ne sont pas tant une conséquence de la diversité des charsets/encodings que de l’absence de métadonnées permettant de les identifier sans équivoque.
Au delà des textes, exploiter des données demande au préalable de pouvoir en identifier la nature.
L’objectif du standard MIME est de normaliser les types de données et leurs déclinaisons,
comme par exemple les types textes :
text/plain,
text/csv,
text/xml,
text/css,
text/html,
etc.
text-plain est du texte brut générique.
Certains types texte, tel que text-plain, nécessitent de connaitre en plus l’encodage utilisé.
D’autres, tel que text/xml, contiennent les méta-données indiquant l’encodage utilisé.
Parmi les types binaires, on trouve :
-
les images :
image/jpeg,image/png,image/tiff, etc. -
le son :
audio/midi,audio/x-flac,audio/x-wav, etc. -
la vidéo :
video/mpeg,video/mp4, etc.
On trouve aussi des types de données spécifiques à des applications :
application/msword,
application/pdf,
application/zip,
etc.
Le type
application/octet-stream
référence le type binaire générique.
Le sous-type vnd (vendor-specific) référence des types proposés par des compagnies privés :
application/vnd.ms-excel,
application/vnd.ms-powerpoint,
application/vnd.apple.keynote,
image/vnd.adobe.photoshop,
image/vnd.mozilla.apng,
video/vnd.motorola.video.
etc.