P
pro·school.ru
Каталог школ

Подсчёт объёма текстового файла

💻 Информатика · 5 класс

Сколько весит текст

Любой текст внутри компьютера хранится как набор закодированных символов. Информационный объём текста — это количество памяти, которое нужно, чтобы этот текст сохранить. Объём измеряют в байтах и более крупных единицах. Чтобы посчитать объём, нужно знать всего две вещи: сколько символов в тексте и сколько памяти занимает один символ.

Этот навык пригодится, чтобы прикинуть, поместится ли документ на флешку, и чтобы понять, почему длинная книга весит больше короткой записки.

Вес одного символа

В простой однобайтовой кодировке, которую изучают в пятом классе, каждый символ занимает ровно 1 байт. При этом важно помнить: символами считаются не только буквы. Символ — это любой знак в тексте: буква, цифра, точка, запятая и даже пробел между словами. Пробел тоже весит 1 байт, ведь без него слова слиплись бы в одну строку.

Что считаем символомПримерВес
Букваа, Б1 байт
Цифра71 байт
Пробел« »1 байт
Знак препинания. ! ,1 байт

Правило подсчёта

Объём текста равен числу всех символов, умноженному на вес одного символа. Если один символ весит 1 байт, то объём в байтах просто равен числу символов — вместе с пробелами и знаками препинания.

Разобранный пример

Найдём объём фразы Привет, мир! при кодировке 1 байт на символ. Считаем по порядку каждый знак, не пропуская пробел и восклицательный знак:

П р и в е т , (пробел) м и р !

Получается: 6 букв слова «Привет» + запятая + пробел + 3 буквы слова «мир» + восклицательный знак = 12 символов.

12 символов × 1 байт = 12 байт

Значит, эта фраза занимает 12 байтов памяти. Если бы один символ кодировали двумя байтами (как в более сложных кодировках), объём оказался бы вдвое больше:

12 символов × 2 байта = 24 байта

От байтов к большим единицам

Когда символов очень много, байтов получается тысячи. Тогда объём удобно переводить в более крупные единицы. Напомним: 1 Кбайт = 1024 байта. Например, страница текста примерно из 2000 символов в однобайтовой кодировке весит около 2000 байтов, то есть почти 2 Кбайта. Целая книга из сотен страниц займёт уже сотни Кбайтов, а это удобнее записывать в Мегабайтах: 1 Мбайт = 1024 Кбайта.

Обратная задача

Иногда известен объём файла, а нужно узнать, сколько в нём символов. Тогда правило применяют наоборот: число символов равно объёму, делённому на вес одного символа. Если файл весит 50 байтов, а каждый символ занимает 1 байт, то в тексте 50 символов. А при весе 2 байта на символ тот же файл вмещал бы только 25 символов.

Частая ошибка: при подсчёте забывают про пробелы и знаки препинания. Пробел — полноценный символ, его обязательно считают. Идите по тексту подряд и отмечайте каждый знак.

Кратко о главном

  • Объём текста — это память, нужная для его хранения, измеряется в байтах.
  • Объём = число символов × вес одного символа.
  • Символами считают буквы, цифры, знаки препинания и пробелы.
  • При весе 1 байт на символ объём в байтах равен числу символов.
  • Тысячи байтов переводят в Кбайты: 1 Кбайт = 1024 байта.