Распознавание текста на изображении
💻 Информатика · 7 класс
Распознавание текста на изображении
Когда страницу книги сканируют, получается картинка — набор цветных точек, а не буквы. Компьютер видит изображение, но не понимает написанных на нём слов: для него это просто узор из пикселей. Чтобы превратить рисунок в редактируемый текст, применяют распознавание текста (по-английски OCR — оптическое распознавание символов).
Зачем это нужно
Отсканированную страницу нельзя исправить, скопировать или найти в ней слово, как в обычном текстовом документе. После распознавания каждый символ становится настоящей буквой, которую можно редактировать, искать, форматировать и переносить в другой документ. Это экономит огромное количество времени по сравнению с ручным перепечатыванием текста с бумаги.
Как работает распознавание
Программа распознавания анализирует изображение по нескольким шагам:
- находит на странице области с текстом и отделяет их от рисунков и пустых полей;
- разбивает текст на строки, строки — на слова, а слова — на отдельные символы;
- сравнивает форму каждого символа с хранящимися образцами и выбирает наиболее похожую букву;
- проверяет полученный результат по словарю, исправляя сомнительные и маловероятные сочетания.
| Этап | Что делает программа |
|---|---|
| Разметка | Находит блоки текста на странице |
| Сегментация | Делит текст на отдельные символы |
| Сравнение | Узнаёт каждую букву по форме |
| Проверка | Сверяет слова со словарём |
Разбор примера
Пусть на скане написано слово «школа». Программа выделит пять символов и подберёт для каждого подходящую букву:
[ш] [к] [о] [л] [а] → "школа"Если бумага была мятой, печать бледной или страница отсканирована криво, программа может ошибиться: принять букву «о» за «с» или «н» за «и». Поэтому распознанный текст всегда стоит вычитывать и сравнивать с оригиналом, особенно в важных документах.
Где применяют распознавание
Распознавание текста используют, чтобы оцифровать старые книги и архивы, перевести бумажные документы в электронный вид, прочитать номер автомобиля на фотографии или ввести текст с визитки в записную книжку телефона. Это одна из самых полезных технологий обработки изображений.
Частая ошибка: думать, что распознавание работает идеально. Качество результата напрямую зависит от чёткости исходного изображения: пятна, наклон страницы, плохое освещение и мелкий шрифт приводят к ошибкам, которые приходится исправлять вручную.
Кратко о главном
- Скан страницы — это картинка из пикселей, а не текст.
- Распознавание превращает изображение букв в редактируемый текст.
- Программа делит изображение на символы и узнаёт каждый.
- Результат зависит от качества скана и требует проверки.