BO
Savoirs | Capacités | Observations |
---|---|---|
Numérisation. L'ordinateur manipule uniquement des valeurs numériques. Une étape de numérisation des objets du monde physique est donc indispensable. | Coder un nombre, un caractère au travers d'un code standard, un texte sous forme d'une liste de valeurs numériques. | Il est ici utile de faire référence à des notions technologiques introduites à propos des architectures matérielles. |
Principes
Le texte est constitué de caractères. On effectue deux étapes :
- Symbole → Nombre
- On fait correspondre à chaque caractère un unique code : c’est le jeu de caractères ou charset ou table de codage ou code point.
- Nombres → Bits
- Ensuite on définit une représentation binaire de tous les codes numériques du charset, c’est l’encoding.
Symbole \( \underbrace{→}_{charset} \) Nombre \(\underbrace{→}_{ encoding}\) Bits
Il existe de nombreux codages des caractères ; les principaux codages sont :
- Le code ASCII (ISO 646) anglais américain, pas d’accents.
- Les codes ISO 8859-1 extension pour les langues d’Europe occidentale.
- Le code Unicode code universel, mis à jour régulièrement.
- Les codes UTF-8 / UTF-16 représentations d’Unicode.