Программа
предназначена для ввода текстовой
информации с графических устройств:
таких как сканер и фотокамера. И
позволяет распознавать образы даже
очень низкого разрешения и очень
низкого
качества, при этом качество
распознавания в несколько раз
лучше, чем у программы Fine Reader, и
может превосходить точность
распознавания
В файлах BMP приведен пример реальной фотографии номера на вагоне с которой производилась деформация различными фильтрами в программе Photoshop, и это еще не предел возможностей программы, вы сами можете попробовать изменить параметры распознавания и тестовые файлы. Отзывы присылайте по адресу E-Mail: grigorlukashenko@mail.ru
Для алгоритма совершенно нет никакой разницы какие символы распознавать: цифры, буквы или любой другой язык. Для наглядности сравнения можете попытаться распознать прилагаемые тесты с помощью программы Fine Reader 4 и прочувствуйте разницу.
Если вам не поверится что программа действительно распознает образы, а просто реагирует на нажатие клавиш, то можете отредактировать тестовые файлы. При нажатии на кнопку (Распознать образ) программа распознает загруженный файл. Вы можете изменить показатель точность распознавания от 1 до 200%, который задает с какой точностью программа должна распознать символ, если символ распознан с меньшей точностью, то он будет пропущен. В данном примере последние цифры распознаются с меньшей точностью, и если заданная точность будет высокой, то эти символы будут пропущены.
Иногда приходят письма от людей которые пробовали подставлять свои файлы для распознавания в программе, но у них ничего не получилось:
S> Привет Григорий. S> Честно признаюсь я не поверил Вашим заявлениям, особенно сомневался что программа способна распознать БитМап под S> номером 20. Зря распознала. Решил удостоверится в её крутизне. Прорисовал ряд S> цифр в поинте и о чудо : не распознала. Странно. Опять же по заверениям она должна распознавать даже те образы S> которые человек не может распознать а тут всего на всего четкие цифры на черном фоне. S> Может я не прав но у меня сложилось 100% отношение что это чистой воды подлог. А вместо распознавания подставляются S> числа с помощью random. S> С уважением, Дмитрий.
Да, мне понятны вашы сомнения. Конечно для большей ясности в данном вопросе, требуется комментарий. Программа распознавания не делает ничего сверхъестественного, она сравнивает эталон образа с тем что видит и пытается определить что это такое. Возможности программ такого класса определяют не только алгоритм но и эталоны которые хранятся в памяти.
Для того чтобы программа работала ее необходимо предварительно обучить. В данном случае я обучил программу на базе первого образа, а дальше после применения различных фильтров, исказил исходную фотографию и сохранил в фотографиях с последующими номерами. Алгоритм пытается найти исходные образы в искаженной фотографии на базе имеющихся эталонов. Функция обучения в демонстрационной версии отключена и вы не сможете проверить ее работу, а только работу OCR алгоритма.
Проблема распознавания образов дополняется и тем, что кроме разных образов есть различные классы образов, например на фотографии 256 оттенков серого и черно-белой фотографиях, похожие символы для человека будут совершенно различными для компьютера. И если вы попытаетесь распознать чорнобелый образ, с помощью программы, которая была предварительно обучена на базе образов 256 оттенков серого, то программа выдаст неадекватный ответ. Но даже если вы попытаетесь распознать образы в формате 256 цветов, скорее всего у вас программа будет часто ошибаться. Дело в том что на класс образа влияет и оборудование с помощью которого производилась съемка и условия освещения и другие многочисленные факторы. Кроме того программа не идеальна и находится в стадии разработки. Демонстрационной версии программы уже более 2-х лет с тех времен значительно улучшилась технология распознавания и оптимизирован алгоритм по скорости и качеству, но у меня нет пока времени, чтобы собрать в кучу новую версию. Кроме того пока и старой версии есть, что показать. В демонстрационной версии я просто хотел показать, что умеет программа и ни о каком жульничестве не было и мысли, просто сложности процесса распознавания образов требуют более детального подхода для успешного понимания.
Если посмотреть на фотографию с номером 20, то программу для распознавание такого образа я не планировал делать, и с другой стороны невозможно распознать уверенно такую фотографию, просто она демонстрирует предельные возможности программы где она начинает ошибаться. После проведения первых испытаний я увидел работоспособность моего алгоритма, которая поразила даже меня.
Не пытайтесь распознавать образы созданные в графическом редакторе программа их не распознает, если вы сомневаетесь, что программа действительно распознает файлы по содержимому а не по названию, вы можете отредактировать тестовые файлы применяя различные фильтры к существующим фотографиям, но не пытайтесь рисовать цифры или печатать их разными шрифтами, текущие эталоны не рассчитаны на распознавание образов созданных на компьютере, они были отсканированы с фотографии и могут работать только с образами данного класса.
Надеюсь этот комментарий хоть немного изменит вашу точку зрения.
http://ocrai.narod.ru E-Mail: ocrai@narod.ru последнее обновление: 11;12;2001