RECHERCHE DE SITE

Codage des informations textuelles sur l'ordinateur

Un ordinateur est un appareil complexe, avec l'aide dequi peut créer, convertir et stocker des informations. Cependant, l'ordinateur ne fonctionne pas très intelligiblement pour nous - les données graphiques, textuelles et numériques sont stockées sous forme de tableaux de données binaires.

encodage d'informations textuelles
nombres Dans cet article, nous verrons comment les informations textuelles sont codées.

Quel est pour nous un texte, pour un ordinateur -séquence de symboles. Chaque symbole représente un ensemble spécifique de zéros et de uns. Sous les symboles, on entend non seulement des lettres minuscules et majuscules de l'alphabet latin, mais aussi des signes de ponctuation, des signes arithmétiques, des symboles de service, des symboles spéciaux et même un espace.

Codage binaire des informations textuelles

Lorsque vous appuyez sur une certaine touche sur le internele contrôleur envoie un signal électrique qui est converti en code binaire. Le code est associé à un caractère spécifique, qui est affiché. Pour représenter l'alphabet latin en format numérique, un système de codage ASCII international a été créé. Il faut 1 octet pour écrire un caractère, donc le symbole consiste en une séquence à huit chiffres de zéros et de uns. L'intervalle d'enregistrement va de 00000000 à 11111111, c'est-à-dire que l'encodage d'informations textuelles utilisant ce système permet la présentation de 256 symboles. Dans la plupart des cas, cela suffit.

codage binaire d'informations textuelles

ASCII est divisé en deux parties. Les 127 premiers caractères (de 00000000 à 01111111) sont internationaux et représentent des caractères et des lettres spécifiques de l'alphabet anglais. La deuxième partie - l'extension (de 10.000.000 à 11111111) - est destinée à représenter l'alphabet national, dont l'écriture est différente du latin.

Encodage des informations textuelles en ASCIIest construit sur le principe de la séquence croissante, c'est-à-dire que plus le nombre de la lettre latine est grand, plus la valeur de son code ASCII est grande. Les chiffres et la partie russe de la table sont construits sur le même principe.

Cependant, il y a plusieurs autres espèces dans le mondecodages pour les lettres cyrilliques. Le plus commun - est KOI-8 (encodage huit bits qui a été utilisé dans les années 70 dans le premier système d'exploitation Unix ruifitsirovannyh), ISO 8859-5 (mis au point par le Bureau international de normalisation), le CP 1251 (codage de l'information textuelle utilisée dans la

encodage et traitement d'informations textuelles
OS Windows moderne), ainsi que 2 octetsCodage Unicode, avec lequel vous pouvez soumettre 65 536 caractères. Une telle variété de codages est due au fait qu'ils ont été développés à différents moments, pour différents systèmes d'exploitation et pour diverses raisons. Pour cette raison, il y a souvent des difficultés à transférer du texte d'un support à un autre - si les encodages ne correspondent pas, l'utilisateur ne verra qu'un ensemble d'icônes incompréhensibles. Comment pouvez-vous résoudre cette situation? Dans Word, par exemple, lorsque vous ouvrez un document, vous recevez un message sur les problèmes d'affichage du texte et propose plusieurs options de transcodage.

Ainsi, l'encodage et le traitement du textel'information dans les profondeurs de l'ordinateur - le processus est plutôt compliqué et prend du temps. Tous les symboles d'un alphabet ne représentent qu'une certaine séquence de chiffres du système binaire, une cellule est un octet d'information.

</ p>
  • Note: