Большинство существующих алгоритмов, решающих задачи
распознавания символов рукописного текста, содержат три основных этапа: предварительная обработка, структурное представление или формирование набора признаков и классификация.
Первый этап направлен на улучшение качества изображения для того, чтобы фон не сливался со значимой информацией. Он включает в себя удаление шумов, повышение контрастности, резкости и преобразование в нужный системе формат. Обработанное изображение попадает в модуль сегментации. На данном этапе происходит выделение структурных элементов текста, таких как строки, слова и отдельные символы. Далее, выявленные фрагменты передаются классификатору, который определяет возможность принадлежности поступившего объекта к той или иной букве.
Программы для распознания рукописного ввода
Именно по этот принцип лежит в основе таких
программ распознавания текста, как
FineReader, Cuneiform, FreeOCR, HappyText и многих других, каждая из которых имеет свои достоинства и недостатки.
ABBYY FineReader , на текущий момент является, пожалуй, одним из самых мощных инструментов для распознавания текста, как рукописного, так и печатного. Последние версии программы позволяют работать со всеми моделями сканеров и МФУ, распознавать изображения низкого качества и снимки, сделанные с помощью камеры мобильных устройств, например телефонов. Недостатком программы можно считать относительно высокую стоимость, доходящую до трех-четырех тысяч рублей за профессиональную версию.
Cuneiform, так же известная как OpenOCR, является
бесплатной программой для распознавания текстов, исходный код которой открыт, что привлекло множество энтузиастов к её усовершенствованию. Она распознает таблицы любой сложности, в том числе и без линий табличной сетки, а так же позволяет сохранять структуру и форматирование документа при его распознавании. К сожалению, техническая поддержка данного продукта представлена весьма условно и ответ на интересующий вас вопрос приходит далеко не всегда.
Из недавно появившихся игроков рынка распознавания текста можно выделить HappyText и FreeOCR, главным достоинством которых является простота использования, небольшой размер и доступность, ведь они распространяются бесплатно. Недостатков существенно больше. Это и полное отсутствие технической поддержки, и нерегулярное обновление и невысокий функционал. А FreeOCR в числе прочего, не умеет автоматически распознавать язык документа, даже если это русский. Впрочем, многим студентам и школьникам для перевода своих и не только записей в электронный вид, функционала этих программ будет достаточно, а тогда зачем лишние сложности, да ещё за свои деньги.