P
pro·school.ru
Каталог школ

Кодирование информации

💻 Информатика · 9 класс

Что значит закодировать информацию

Кодирование — это представление информации в виде, удобном для хранения, передачи и обработки. В компьютере вся информация — текст, изображения, звук — представлена последовательностью нулей и единиц. Минимальная единица информации — бит (один двоичный разряд), а восемь битов образуют байт.

ЕдиницаРазмер
1 байт8 бит
1 килобайт1024 байта
1 мегабайт1024 килобайта
1 гигабайт1024 мегабайта

Кодирование текста

Каждому символу ставится в соответствие числовой код. В кодировке ASCII один символ занимает один байт, что даёт 256 различных символов. В современной кодировке Unicode символ может занимать два и более байта, что позволяет хранить алфавиты всех языков мира.

Объём текста вычисляют так: количество символов умножают на размер одного символа.

Текст из 200 символов, по 1 байту: 200 * 1 = 200 байт = 1600 бит

Кодирование изображений

Растровое изображение состоит из точек — пикселей. Каждый пиксель имеет свой цвет, который кодируется числом. Глубина цвета — число битов на один пиксель. Если на пиксель отводится i битов, то число цветов в палитре равно 2^i.

Изображение 100 x 50 пикселей, глубина цвета 8 бит: 100 * 50 = 5000 пикселей 5000 * 8 = 40000 бит = 5000 байт

Кодирование звука

Звук — это волна. Чтобы записать его в компьютере, проводят дискретизацию: измеряют громкость много раз в секунду. Частота дискретизации — число измерений в секунду, а глубина кодирования — число битов на одно измерение. Чем они больше, тем выше качество и больше объём файла.

Частота 8000 измерений в секунду, глубина 16 бит, длительность 2 секунды: 8000 * 16 * 2 = 256000 бит = 32000 байт

Сжатие данных

Файлы с изображениями, звуком и видео занимают много места, поэтому их часто сжимают — записывают компактнее, убирая избыточность. Сжатие бывает без потерь, когда исходные данные восстанавливаются точно, и с потерями, когда часть малозаметной информации отбрасывается ради меньшего размера файла. Архиваторы используют сжатие без потерь, а популярные форматы фотографий и музыки — сжатие с потерями.

Единый принцип

Несмотря на разную природу данных, во всех случаях действует единый принцип: информацию разбивают на мелкие части и каждой части ставят в соответствие числовой код, который хранится в двоичном виде. Это позволяет компьютеру одинаково работать с текстом, картинкой и звуком.

Частые ошибки: при переводе единиц используют множитель 1024, а не 1000. Число цветов и число символов растёт как степень двойки, а не линейно. Нельзя путать бит и байт: в байте восемь бит.

Кратко о главном

  • Кодирование — представление данных в двоичном виде.
  • Бит — наименьшая единица, байт — восемь бит; множитель единиц 1024.
  • Текст: каждому символу — числовой код (ASCII, Unicode).
  • Изображение: число цветов равно 2^i, где i — глубина цвета.
  • Звук кодируют дискретизацией: частота и глубина кодирования задают качество.