Cognitive OpenOCR – бесплатная программа распознавания текста
Cognitive OpenOCR (бывшая OCR CUNEIFORM) – это бесплатная программа для сканирования и распознавания текста. Разработана российской компанией Cognitive Technologies.
Первоначально программа выпускалась как коммерческий продукт, причем на российском рынке была жесткая конкуренция между CUNEIFORM и конкурирующим FineReader. В 2007 года компания Cognitive Technologies стала распространять программу бесплатно, а в апреле 2008 года Cognitive Technologies открыла исходные коды интерфейса системы распознавания текстов OCR Cuneiform и анонсировала дальнейшие планы развития проекта Cognitive OpenOCR. Об этом было объявлено на выставке Softool 2008 на совместной с GNU/Linuxcenter пресс-конференции. На мероприятии были продемонстрированы уже имеющиеся результаты проекта — показана работа OCR-комплекса, собранного из кодов ядра распознавания, под управлением ОС Linux.
OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.
Сегодня OCR CuneiForm это:
- высокое качество распознавания;
- высокая скорость работы;
- распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);
- работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и
- полуавтоматической фрагментации;
- распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;
- автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;
- полное сохранение топологии страницы;
- поддержка пакетного режима сканирования и распознавания;
- простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;
- встроенный текстовый редактор для работы с распознанным текстом;
- совмещенный показ изображений и результатов распознавания.
В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.
Скачать бесплатную версию с сайта разработчика: http://openocr.org/download/