P
pro·school.ru
Каталог школ

Распознавание текста на изображении

💻 Информатика · 7 класс

Распознавание текста на изображении

Когда страницу книги сканируют, получается картинка — набор цветных точек, а не буквы. Компьютер видит изображение, но не понимает написанных на нём слов: для него это просто узор из пикселей. Чтобы превратить рисунок в редактируемый текст, применяют распознавание текста (по-английски OCR — оптическое распознавание символов).

Зачем это нужно

Отсканированную страницу нельзя исправить, скопировать или найти в ней слово, как в обычном текстовом документе. После распознавания каждый символ становится настоящей буквой, которую можно редактировать, искать, форматировать и переносить в другой документ. Это экономит огромное количество времени по сравнению с ручным перепечатыванием текста с бумаги.

Как работает распознавание

Программа распознавания анализирует изображение по нескольким шагам:

  1. находит на странице области с текстом и отделяет их от рисунков и пустых полей;
  2. разбивает текст на строки, строки — на слова, а слова — на отдельные символы;
  3. сравнивает форму каждого символа с хранящимися образцами и выбирает наиболее похожую букву;
  4. проверяет полученный результат по словарю, исправляя сомнительные и маловероятные сочетания.
ЭтапЧто делает программа
РазметкаНаходит блоки текста на странице
СегментацияДелит текст на отдельные символы
СравнениеУзнаёт каждую букву по форме
ПроверкаСверяет слова со словарём

Разбор примера

Пусть на скане написано слово «школа». Программа выделит пять символов и подберёт для каждого подходящую букву:

[ш] [к] [о] [л] [а] → "школа"

Если бумага была мятой, печать бледной или страница отсканирована криво, программа может ошибиться: принять букву «о» за «с» или «н» за «и». Поэтому распознанный текст всегда стоит вычитывать и сравнивать с оригиналом, особенно в важных документах.

Где применяют распознавание

Распознавание текста используют, чтобы оцифровать старые книги и архивы, перевести бумажные документы в электронный вид, прочитать номер автомобиля на фотографии или ввести текст с визитки в записную книжку телефона. Это одна из самых полезных технологий обработки изображений.

Частая ошибка: думать, что распознавание работает идеально. Качество результата напрямую зависит от чёткости исходного изображения: пятна, наклон страницы, плохое освещение и мелкий шрифт приводят к ошибкам, которые приходится исправлять вручную.

Кратко о главном

  • Скан страницы — это картинка из пикселей, а не текст.
  • Распознавание превращает изображение букв в редактируемый текст.
  • Программа делит изображение на символы и узнаёт каждый.
  • Результат зависит от качества скана и требует проверки.