Попробуйте прочитать это и не только это


Программа предназначена для ввода текстовой информации с графических устройств: таких как сканер и фотокамера. И позволяет распознавать образы даже очень низкого разрешения и очень низкого качества, при этом качество распознавания в несколько раз лучше, чем у программы Fine Reader, и может превосходить точность распознавания человеком, а по скорости распознавания значительно опережает его.Для просмотра необходимо запустить файл demo_ocr.exe. После старта автоматически загружается первый тест и распознается. В результатах приводиться информация: распознанная текстовая строка, информация о том с какой точностью был распознан каждый символ и проверка правильности распознавания теста. Для распознавания следующего теста достаточно нажать кнопку (Следующий файл).

В файлах BMP приведен пример реальной фотографии номера на вагоне с которой производилась деформация различными фильтрами в программе Photoshop, и это еще не предел возможностей программы, вы сами можете попробовать изменить параметры распознавания и тестовые файлы. Отзывы присылайте по адресу E-Mail: grigorlukashenko@mail.ru

Для алгоритма совершенно нет никакой разницы какие символы распознавать: цифры, буквы или любой другой язык. Для наглядности сравнения можете попытаться распознать прилагаемые тесты с помощью программы Fine Reader 4 и прочувствуйте разницу.

Если вам не поверится что программа действительно распознает образы, а просто реагирует на нажатие клавиш, то можете отредактировать тестовые файлы. При нажатии на кнопку (Распознать образ) программа распознает загруженный файл. Вы можете изменить показатель точность распознавания от 1 до 200%, который задает с какой точностью программа должна распознать символ, если символ распознан с меньшей точностью, то он будет пропущен. В данном примере последние цифры распознаются с меньшей точностью, и если заданная точность будет высокой, то эти символы будут пропущены.


Некоторые комментарии и дополнения:


Иногда приходят письма от людей которые пробовали подставлять свои файлы для распознавания в программе, но у них ничего не получилось:

	S> Привет Григорий.

	S>     Честно признаюсь я не поверил Вашим заявлениям, особенно сомневался что программа способна 
	   распознать БитМап под
	S> номером 20. Зря распознала. Решил удостоверится в её крутизне. Прорисовал ряд
	S> цифр в поинте и о чудо : не распознала. Странно. Опять же по заверениям она должна распознавать 
	   даже те образы
	S> которые человек не может распознать а тут всего на всего четкие цифры на черном фоне.
	S> Может я не прав но у меня сложилось 100% отношение что это чистой воды подлог. А вместо 
           распознавания подставляются
	S> числа с помощью random.

	S> С уважением, Дмитрий.

Да, мне понятны вашы сомнения. Конечно для большей ясности в данном вопросе, требуется комментарий. Программа распознавания не делает ничего сверхъестественного, она сравнивает эталон образа с тем что видит и пытается определить что это такое. Возможности программ такого класса определяют не только алгоритм но и эталоны которые хранятся в памяти.

Для того чтобы программа работала ее необходимо предварительно обучить. В данном случае я обучил программу на базе первого образа, а дальше после применения различных фильтров, исказил исходную фотографию и сохранил в фотографиях с последующими номерами. Алгоритм пытается найти исходные образы в искаженной фотографии на базе имеющихся эталонов. Функция обучения в демонстрационной версии отключена и вы не сможете проверить ее работу, а только работу OCR алгоритма.

Проблема распознавания образов дополняется и тем, что кроме разных образов есть различные классы образов, например на фотографии 256 оттенков серого и черно-белой фотографиях, похожие символы для человека будут совершенно различными для компьютера. И если вы попытаетесь распознать чорнобелый образ, с помощью программы, которая была предварительно обучена на базе образов 256 оттенков серого, то программа выдаст неадекватный ответ. Но даже если вы попытаетесь распознать образы в формате 256 цветов, скорее всего у вас программа будет часто ошибаться. Дело в том что на класс образа влияет и оборудование с помощью которого производилась съемка и условия освещения и другие многочисленные факторы. Кроме того программа не идеальна и находится в стадии разработки. Демонстрационной версии программы уже более 2-х лет с тех времен значительно улучшилась технология распознавания и оптимизирован алгоритм по скорости и качеству, но у меня нет пока времени, чтобы собрать в кучу новую версию. Кроме того пока и старой версии есть, что показать. В демонстрационной версии я просто хотел показать, что умеет программа и ни о каком жульничестве не было и мысли, просто сложности процесса распознавания образов требуют более детального подхода для успешного понимания.

Если посмотреть на фотографию с номером 20, то программу для распознавание такого образа я не планировал делать, и с другой стороны невозможно распознать уверенно такую фотографию, просто она демонстрирует предельные возможности программы где она начинает ошибаться. После проведения первых испытаний я увидел работоспособность моего алгоритма, которая поразила даже меня.

Не пытайтесь распознавать образы созданные в графическом редакторе программа их не распознает, если вы сомневаетесь, что программа действительно распознает файлы по содержимому а не по названию, вы можете отредактировать тестовые файлы применяя различные фильтры к существующим фотографиям, но не пытайтесь рисовать цифры или печатать их разными шрифтами, текущие эталоны не рассчитаны на распознавание образов созданных на компьютере, они были отсканированы с фотографии и могут работать только с образами данного класса.

Надеюсь этот комментарий хоть немного изменит вашу точку зрения.

Скачать демо версию 182 Кбайт


http://ocrai.narod.ru E-Mail: ocrai@narod.ru последнее обновление: 11;12;2001



Hosted by uCoz