Архивация и сжатие файлов
💻 Информатика · 6 класс
Архивация и сжатие файлов
Архивация — это упаковка одного или нескольких файлов в единый файл-архив, при которой их общий размер обычно уменьшается. Программу, которая выполняет такую упаковку, называют архиватором. Сжатие происходит за счёт того, что в данных часто встречаются повторяющиеся участки, и эти повторы можно записать гораздо короче, не потеряв смысла.
Архивы нужны человеку каждый день, даже если он этого не замечает. Когда мы пересылаем по почте папку с фотографиями или скачиваем программу из интернета, чаще всего мы имеем дело именно с архивом. Понимание того, как он устроен, помогает экономить место и время.
Зачем нужна архивация
Архивы решают сразу несколько задач. Во-первых, экономится место на диске и в памяти при пересылке. Во-вторых, несколько файлов превращаются в один — его удобно отправлять по электронной почте или копировать на флешку. В-третьих, упакованные данные меньше страдают при передаче по сети, ведь передаётся один аккуратный файл, а не десятки разрозненных.
- уменьшение объёма — текст и таблицы сжимаются очень сильно;
- объединение — целая папка хранится как один файл;
- удобство пересылки — одно вложение вместо десятков;
- сохранность — структура папок не теряется при передаче.
Как работает сжатие
Идея проста: повторяющийся фрагмент заменяется на короткую ссылку или счётчик. Например, строку из нескольких одинаковых символов можно записать как «символ и число повторов». Рассмотрим запись подряд идущих букв:
ААААААБББ -> 6А3Б
Вместо девяти знаков получилось четыре — это и есть простейшее сжатие. Сжатие без потерь означает, что после распаковки получится точно тот же файл, символ в символ. Так сжимают тексты, таблицы и программы, где важна каждая мелочь. Для фотографий и музыки применяют сжатие с потерями, когда часть малозаметных деталей отбрасывают ради меньшего размера; на глаз и на слух разница почти не видна.
Степень сжатия у разных данных
Насколько сильно уменьшится файл, зависит от того, много ли в нём повторов. Сравним типичные случаи в таблице.
| Тип данных | Сжатие | Причина |
|---|---|---|
| Текстовый документ | сильное | много повторов слов и пробелов |
| Таблица с числами | сильное | повторяющиеся значения |
| Готовый рисунок-фото | слабое | уже сжат заранее |
| Музыка в сжатом формате | почти нет | повторов мало |
Как создать и распаковать архив
Чтобы создать архив, в проводнике выделяют нужные файлы, вызывают команду «Добавить в архив», задают имя и получают готовый файл-архив. Чтобы вернуть данные в обычный вид, архив распаковывают, то есть извлекают из него файлы. Пока файлы лежат внутри архива, полноценно работать с ними нельзя — сначала их нужно извлечь.
Частые ошибки. Распространено мнение, что архив можно сжать ещё раз и он станет меньше — это не так: повторно сжатые данные почти не уменьшаются, ведь повторы уже убраны. Также нельзя редактировать файлы прямо «внутри» архива, не извлекая их наружу.
Кратко о главном
- Архивация — упаковка файлов в один архив с уменьшением размера.
- Сжатие убирает повторы; бывает без потерь и с потерями.
- Тексты и таблицы сжимаются сильно, фото и музыка — слабо.
- Архив нужно распаковать, прежде чем работать с файлами.
- Повторное сжатие архива почти не уменьшает его объём.