Un ordinateur est un appareil complexe, avec l'aide dequi peut créer, convertir et stocker des informations. Cependant, l'ordinateur ne fonctionne pas très intelligiblement pour nous - les données graphiques, textuelles et numériques sont stockées sous forme de tableaux de données binaires.
Quel est pour nous un texte, pour un ordinateur -séquence de symboles. Chaque symbole représente un ensemble spécifique de zéros et de uns. Sous les symboles, on entend non seulement des lettres minuscules et majuscules de l'alphabet latin, mais aussi des signes de ponctuation, des signes arithmétiques, des symboles de service, des symboles spéciaux et même un espace.
Codage binaire des informations textuelles
Lorsque vous appuyez sur une certaine touche sur le internele contrôleur envoie un signal électrique qui est converti en code binaire. Le code est associé à un caractère spécifique, qui est affiché. Pour représenter l'alphabet latin en format numérique, un système de codage ASCII international a été créé. Il faut 1 octet pour écrire un caractère, donc le symbole consiste en une séquence à huit chiffres de zéros et de uns. L'intervalle d'enregistrement va de 00000000 à 11111111, c'est-à-dire que l'encodage d'informations textuelles utilisant ce système permet la présentation de 256 symboles. Dans la plupart des cas, cela suffit.
ASCII est divisé en deux parties. Les 127 premiers caractères (de 00000000 à 01111111) sont internationaux et représentent des caractères et des lettres spécifiques de l'alphabet anglais. La deuxième partie - l'extension (de 10.000.000 à 11111111) - est destinée à représenter l'alphabet national, dont l'écriture est différente du latin.
Encodage des informations textuelles en ASCIIest construit sur le principe de la séquence croissante, c'est-à-dire que plus le nombre de la lettre latine est grand, plus la valeur de son code ASCII est grande. Les chiffres et la partie russe de la table sont construits sur le même principe.
Cependant, il y a plusieurs autres espèces dans le mondecodages pour les lettres cyrilliques. Le plus commun - est KOI-8 (encodage huit bits qui a été utilisé dans les années 70 dans le premier système d'exploitation Unix ruifitsirovannyh), ISO 8859-5 (mis au point par le Bureau international de normalisation), le CP 1251 (codage de l'information textuelle utilisée dans la
Ainsi, l'encodage et le traitement du textel'information dans les profondeurs de l'ordinateur - le processus est plutôt compliqué et prend du temps. Tous les symboles d'un alphabet ne représentent qu'une certaine séquence de chiffres du système binaire, une cellule est un octet d'information.
</ p>