Российские OCR программы для распознавания документов (аналоги FineReader)

Обновлено: 21.09.2023
Примеры платных и бесплатных российских альтернатив FineReader - представлены ниже.

Пользователи, которые искали Российский FineReader, потом также интересовались следующими продуктами:

См. также: Топ 10: OCR программы

2023. Российская наследница Abbyy просит у властей 258 млн чтоб импортозаместить Abbyy FineReader



Российская компания Content AI (которую создали сотрудники Abbyy после ее ухода из России) запросила у государства 258,6 млн руб. на разработку замены системы распознавания текстов Abbyy FineReader и системы потокового ввода документов ABBYY FlexiCapture. Гендиректор Content AI Светлана Дергачева рассказала, что продукт, на который запрашиваются средства, уже (чудесным образом) создан. Он называется ContentCapture. Но компания просит финансирование для того, чтобы "ускорить процесс выпуска версии продукта с более широкой функциональностью, включая поддержку Linux". Интересно, что кроме ContentCapture существует еще несколько российских аналогов FineReader - Beorg Smart Vision (компании Биорг), Directum Ario One (компании Directum), Smart Document Engine (компании Smart Engines). Но раз государство дает деньги, почему бы не попросить.


2022. Content AI выпустила редактор PDF-документов под новым названием - ContentReader PDF



Российский разработчик решений в области интеллектуальной обработки информации Content AI осуществил модификацию многофункционального редактора PDF-файлов. Ранее известный на рынке продукт FineReader PDF теперь имеет название ContentReader PDF. В рамках текущего релиза редактор выпущен под 15 версией, поскольку сохранил основные возможности FineReader PDF 15, включая распознавание, редактирование и конвертирование PDF-документов в различные форматы, поиск информации внутри файлов, создание интерактивных форм, сравнение документов разного типа и Hot Folder в лицензии Corporate. «Выпуск ContentReader PDF 15 связаны с передачей прав на распространение и развитие линейки продуктов для редактирования PDF компании Content AI», — отметила генеральный директор компании Светлана Дергачева.


2022. Обработка сканов и фото документов на основе «no-code» технологии извлечения реквизитов (OCR) в Paydox Cloud



В облачном приложении для поддержки совместной работы Paydox Cloud появилась подсистема распознавания текстов Paydox OCR. Функциональность Paydox OCR предоставляет возможность распознавать тексты из сканированных образов и фотографий, автоматически извлекать реквизиты документов на основе «no-code» правил извлечения атрибутов и записывать их в базу данных. Данная технология позволяет создавать структурированное хранилище документов с автоматически заполняемыми карточками документов. Пользователи самостоятельно без программирования могут формировать правила извлечения реквизитов из документов, создавать HTML-формы для просмотра и редактирования извлеченных атрибутов и осуществлять контекстный поиск по извлеченным реквизитам. Также возможна настройка приложения на поточную обработку очереди входящих сканов документов.


2022. SETERE OCR - отечественный аналог ABBYY FineReader



Программу для OCR-распознавания текста ABBYY FineReader еще недавно тоже можно было назвать отечественной, но еще за месяц до войны компания ABBYY отозвала все свои продукты из Реестра отечественного ПО ради того, чтоб сфокусироваться на зарубежных рынках. Зато, теперь у нас в реестре есть SETERE OCR - система оптического распознавания текста, которая после последнего релиза (по словам разработчиков) стала близкой к реализации полного функционала ABBYY FineReader. SETERE OCR позволяет пользователям распознавать текст на 190 языках, проверять грамматику, работает с PDF и сканами. А главное преимущество программы - в том, что она работает не на вражеском Windows (который скоро перестанет обновляться в России), а на отечественных Линуксах - Astra Linux и РЕД ОС.


2022. FineReader и другие продукты Abbyy перестали быть российским ПО



Всемирно известная российская софтверная компания Abbyy удалила почти все свои продукты из Реестра отечественного ПО. В числе потерь реестра — программа для распознавания текста Abbyy FineReader, ПО для потокового ввода данных Abbyy FlexiCapture, сканер визиток Abbyy Business Card Reader, решение для создания снимков областей экрана Abbyy Screenshot Reader, ПО для создания мобильных приложений Abbyy Mobile OCR Engine и др. Компания по собственной инициативе подала заявку об исключении продуктов, потому что передала права на продукты своим американским юрлицам. Вероятно, это сделано чтоб не попасть под санкции.


2018. Smart Engines - система извлечения данных из документов



Российская компания Smart Engines разработала ряд приложений, которые (с помощью компьютерного зрения) умеют распознавать и считывать данные из различных стандартных документов (паспортов, ID-карт, водительских удостоверений, СНИЛС, банковских карт ...). Такое приложение может здорово сэкономить время сотрудникам, заполняющим формы по клиентским документам (и, соответственно, сократить время ожидания клиентов). Кроме того, Smart Engines предлагает быструю разработку кастомных приложений для компаний. Например, они разработали мобильное приложение для IKEA, которое распознает этикетки IKEA и умеет извлекать из них артикул, ряд и место товара на складе.


2016. Анкета24 - сервис по распознаванию рукописных анкет


К сожалению программ, которые бы достаточно точно распознавали рукописный текст - пока нет. Для этого нужен искусственный интеллект. Поэтому, анкеты, заполненные вручную (например, клиентами в торговой точке, партнерами на выставке, кандидатами на работу в отделе кадров) - приходится вводить самостоятельно. Но сервис Анкета24 может решить эту проблему. Он использует живых операторов (которые справляются с задачей распознавания рукописного текста не хуже искусственного интеллекта). Причем, сервис конвертирует отсканированную или сфотканную анкету в электронный вид почти в реальном времени (от 60 секунд). Стоимость - от 2 до 12 рублей за анкету. Создатели сервиса говорят, что один и тот же текст набирают много операторов дважды (для скорости и точности), при этом каждый оператор видит только отдельные слова, а не всю анкету в целом - таким образом, конфиденциальные данные не будут раскрыты.