Форматы текстовых файлов
💻 Информатика · 7 класс
Что такое формат текстового файла
Формат текстового файла — это способ хранения текста на диске: записываются ли только символы или ещё и сведения об их оформлении. От формата зависит, увидим ли мы шрифты, размеры, цвета и таблицы, или только «голые» буквы. Текстовые форматы делят на формат простого текста и форматы форматированного текста.
Простой и форматированный текст
Простой текст хранит только символы — буквы, цифры, знаки, пробелы и переводы строк. Никакого оформления в нём нет. Такой файл откроется в любой программе, занимает мало места, но не умеет хранить жирный шрифт или картинки.
Форматированный текст хранит, кроме символов, сведения об оформлении: шрифт, начертание, размер, выравнивание, вставленные изображения и таблицы. Такой файл выглядит богаче, но занимает больше места и требует определённой программы для открытия.
| Формат | Тип | Что хранит |
|---|---|---|
| TXT | простой | только символы |
| RTF | форматированный | текст и базовое оформление |
| DOCX | форматированный | текст, оформление, объекты |
| ODT | форматированный | текст, оформление, объекты |
| для просмотра | точный вид страницы |
Разбор примера
Сравним хранение слова с выделением. В простом тексте сохранится только сама последовательность букв:
Привет
В форматированном файле рядом с буквами хранятся и команды оформления, например указание сделать слово полужирным. Поэтому при открытии оно отобразится жирным, чего простой текст передать не может.
Частая ошибка. Расширение имени файла не меняет его содержимое. Если просто переименовать.txtв.docx, оформление не появится — внутри по-прежнему останется простой текст. Формат определяется способом записи данных, а не именем.
Когда что выбирать
Простой текст удобен для заметок, исходных данных и программ. Форматированный текст нужен для документов с оформлением — рефератов, отчётов, писем. Формат PDF применяют, когда важно сохранить точный вид страницы на любом устройстве.
Почему простой текст универсален
Файл простого текста состоит только из кодов символов, без всяких добавочных сведений. Поэтому его прочитает любая программа на любом устройстве — от древнего компьютера до смартфона. Именно из-за этой универсальности простой текст используют для хранения исходных кодов программ, настроек и больших таблиц данных. Чем «беднее» формат, тем он совместимее.
| Свойство | Простой текст | Форматированный текст |
|---|---|---|
| Размер файла | маленький | больше |
| Совместимость | очень высокая | зависит от программы |
| Оформление | отсутствует | есть |
| Картинки и таблицы | нельзя | можно |
Кодировка символов
Даже в простом тексте важно, в какой кодировке записаны символы. Кодировка задаёт соответствие между символом и его числовым кодом. Если файл открыть в неверной кодировке, вместо русских букв появятся непонятные знаки. Современный стандарт — кодировка UTF-8, поддерживающая буквы почти всех языков мира.
Кратко о главном
- Формат задаёт, что хранится в текстовом файле.
- Простой текст хранит только символы.
- Форматированный текст хранит ещё и оформление.
- Расширение имени не меняет содержимое файла.
- Выбор формата зависит от задачи: заметка, документ или печать.