Cognitive OpenOCR – бесплатная программа распознавания текста

Cognitive OpenOCR (бывшая OCR CUNEIFORM) – это бесплатная программа для сканирования и распознавания текста. Разработана российской компанией Cognitive Technologies.

Первоначально программа выпускалась как коммерческий продукт, причем на российском рынке была жесткая конкуренция между CUNEIFORM и конкурирующим FineReader. В 2007 года компания Cognitive Technologies стала распространять программу бесплатно, а в апреле 2008 года Cognitive Technologies открыла исходные коды интерфейса системы распознавания текстов OCR Cuneiform и анонсировала дальнейшие планы развития проекта Cognitive OpenOCR. Об этом было объявлено на выставке Softool 2008 на совместной с GNU/Linuxcenter пресс-конференции. На мероприятии были продемонстрированы уже имеющиеся результаты проекта — показана работа OCR-комплекса, собранного из кодов ядра распознавания, под управлением ОС Linux.CuneiForm

OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.

Сегодня OCR CuneiForm это:

  • высокое качество распознавания;
  • высокая скорость работы;
  • распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);
  • работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и
  • полуавтоматической фрагментации;
  • распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;
  • автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;
  • полное сохранение топологии страницы;
  • поддержка пакетного режима сканирования и распознавания;
  • простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;
  • встроенный текстовый редактор для работы с распознанным текстом;
  • совмещенный показ изображений и результатов распознавания.

В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.

Скачать бесплатную версию с сайта разработчика: http://openocr.org/download/