P
pro·school.ru
Каталог школ

Кодирование текста в компьютере

💻 Информатика · 6 класс

Как компьютер кодирует текст

Кодирование текста — это сопоставление каждому символу (букве, цифре, знаку препинания, пробелу) определённого числового кода. Компьютер не хранит сами буквы — он хранит их номера в специальной кодовой таблице. Чтобы текст одинаково читался на разных машинах, люди договорились о единых таблицах кодов.

Каждый символ обычно занимает один байт — группу из восьми битов. Одним байтом можно закодировать 256 различных символов, и этого хватает на буквы русского и латинского алфавитов, цифры, знаки препинания и служебные символы. В современных таблицах на символ может отводиться и больше места, но в школьном курсе используют простой случай: один символ — один байт.

Кодовая таблица

В кодовой таблице каждому символу соответствует свой код. Прописные и строчные буквы имеют разные номера, как и пробел, цифра или знак вопроса. Зная код, машина выводит на экран нужный символ, а при наборе текста, наоборот, превращает символ в его код.

СимволКод (условный)
пробел32
цифра 048
буква А192
буква Б193
буква а224
Правило: один символ текста занимает один байт. Чтобы узнать объём текста в байтах, нужно сосчитать число символов, включая пробелы и знаки препинания.

Разбор примера

Посчитаем, сколько байтов займёт слово вместе с восклицательным знаком.

Слово: Ура!

Символы: У, р, а, ! — всего 4

Объём: 4 символа × 1 байт = 4 байта

А фраза «Привет, мир!» содержит 11 символов, если считать запятую, пробел между словами и восклицательный знак. Значит, она занимает 11 байтов. Обратите внимание: пробел — такой же символ, как буква, и у него тоже есть свой код.

Зачем нужны единые таблицы

Если бы каждый компьютер кодировал буквы по-своему, то текст, набранный на одной машине, на другой превратился бы в бессмыслицу. Чтобы этого не происходило, придумали общие кодовые таблицы. Благодаря им письмо, отправленное с одного компьютера, читается на другом ровно так, как было написано.

Как посчитать объём текста

Чтобы узнать, сколько памяти займёт текст, действуют по простому плану. Сначала считают все символы подряд, не пропуская пробелы, запятые, точки и другие знаки. Затем умножают полученное число на размер одного символа — на один байт. Так получают объём текста в байтах. Например, в строке из 200 символов будет ровно 200 байтов. Этот подсчёт показывает, почему длинные документы занимают больше места, чем короткие записки: каждый лишний символ добавляет ещё один байт.

Частые ошибки

  • Забывают считать пробелы и знаки препинания — они тоже символы и занимают по байту.
  • Думают, что заглавная и строчная буквы имеют один код, — у них разные номера.
  • Путают количество слов с количеством символов при подсчёте объёма.

Кратко о главном

  • Текст кодируется по кодовой таблице: каждому символу — свой номер.
  • Один символ обычно занимает один байт.
  • Одним байтом можно закодировать 256 символов.
  • Объём текста в байтах равен числу всех символов, включая пробелы и знаки.