Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
 
+7 (4912) 72-03-73
 
Интернет-портал РГРТУ: https://rsreu.ru

УДК 004.93

СПЕЦИАЛИЗИРОВАННЫЙ МЕТОД РАСПОЗНАВАНИЯ ТЕКСТА ДЛЯ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ПАСПОРТНЫХ ДАННЫХ

П. С. Другов, младший научный сотрудник СПИИРАН, магистрант СПбГЭТУ, Санкт-Петербург, Россия;
orcid.org/0000-0002-0319-0554, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Е. Е. Усина, младший научный сотрудник СПИИРАН, магистрант СПбГУАП, Санкт-Петербург, Россия;
orcid.org/0000-0001-9745-0216, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

При разработке интеллектуального пространства для внедрения на базе имеющейся инфраструктуры предприятия актуальной является задача добавления паспортных данных о новых посетителях в систему предприятия.
Целью данной статьи является разработка метода для распознавания текста страниц паспорта гражданина РФ с изображений, полученных с применением камеры высокого разрешения. Разработанный метод ориентирован на работу с паспортом гражданина РФ и включает такие операции, как: увеличение изображения, сегментация объекта (паспорта), обработка изображения фильтрами и распознавание текста. Для тестирования данного метода был разработан вертикальный стенд с областью для размещения документа в верхней части и написан код на языке
Python. В результате тестирования программы было выявлено, что самый высокий процент распознавания текста достигается при расстоянии от камеры до документа в 25 см – 88,8 %, тогда, как при увеличении фокусировки камеры и отдалении, были получены результаты 66,7 % и 22,2 % соответственно. Внедрение данного метода на предприятии позволило бы избежать ошибок при переносе информации, обусловленных человеческим фактором (невнимательностью или утомленностью работника), а также сократило бы время занесения данных в клиентскую базу.

Ключевые слова: распознавание текста, OCR, Tesseract, оптическое распознавание символов, OpenCV, обработка изображения, паспорт РФ, интеллектуальное пространство.

 Скачать статью