Кодирование информации
💻 Информатика · 9 класс
Что значит закодировать информацию
Кодирование — это представление информации в виде, удобном для хранения, передачи и обработки. В компьютере вся информация — текст, изображения, звук — представлена последовательностью нулей и единиц. Минимальная единица информации — бит (один двоичный разряд), а восемь битов образуют байт.
| Единица | Размер |
|---|---|
| 1 байт | 8 бит |
| 1 килобайт | 1024 байта |
| 1 мегабайт | 1024 килобайта |
| 1 гигабайт | 1024 мегабайта |
Кодирование текста
Каждому символу ставится в соответствие числовой код. В кодировке ASCII один символ занимает один байт, что даёт 256 различных символов. В современной кодировке Unicode символ может занимать два и более байта, что позволяет хранить алфавиты всех языков мира.
Объём текста вычисляют так: количество символов умножают на размер одного символа.
Текст из 200 символов, по 1 байту:
200 * 1 = 200 байт = 1600 битКодирование изображений
Растровое изображение состоит из точек — пикселей. Каждый пиксель имеет свой цвет, который кодируется числом. Глубина цвета — число битов на один пиксель. Если на пиксель отводится i битов, то число цветов в палитре равно 2^i.
Изображение 100 x 50 пикселей,
глубина цвета 8 бит:
100 * 50 = 5000 пикселей
5000 * 8 = 40000 бит = 5000 байтКодирование звука
Звук — это волна. Чтобы записать его в компьютере, проводят дискретизацию: измеряют громкость много раз в секунду. Частота дискретизации — число измерений в секунду, а глубина кодирования — число битов на одно измерение. Чем они больше, тем выше качество и больше объём файла.
Частота 8000 измерений в секунду,
глубина 16 бит, длительность 2 секунды:
8000 * 16 * 2 = 256000 бит = 32000 байтСжатие данных
Файлы с изображениями, звуком и видео занимают много места, поэтому их часто сжимают — записывают компактнее, убирая избыточность. Сжатие бывает без потерь, когда исходные данные восстанавливаются точно, и с потерями, когда часть малозаметной информации отбрасывается ради меньшего размера файла. Архиваторы используют сжатие без потерь, а популярные форматы фотографий и музыки — сжатие с потерями.
Единый принцип
Несмотря на разную природу данных, во всех случаях действует единый принцип: информацию разбивают на мелкие части и каждой части ставят в соответствие числовой код, который хранится в двоичном виде. Это позволяет компьютеру одинаково работать с текстом, картинкой и звуком.
Частые ошибки: при переводе единиц используют множитель 1024, а не 1000. Число цветов и число символов растёт как степень двойки, а не линейно. Нельзя путать бит и байт: в байте восемь бит.
Кратко о главном
- Кодирование — представление данных в двоичном виде.
- Бит — наименьшая единица, байт — восемь бит; множитель единиц 1024.
- Текст: каждому символу — числовой код (
ASCII,Unicode). - Изображение: число цветов равно
2^i, гдеi— глубина цвета. - Звук кодируют дискретизацией: частота и глубина кодирования задают качество.