CyberSecurity.ru : Новости

вторник, 13 апреля 2010 г.

Система оптического распознавания


OCR CUNEIFORM - это система оптического распознавания ведущего российского разработчика программного обеспечения Cognitive Technologies. OCR CuneiForm обеспечивает быстрое и высококачественное преобразование бумажных документов и электронных графических файлов в редактируемый текст для последующей работы с ним.

OCR CuneiForm отличается от других программ этого класса высоким уровнем распознавания, особенно текстов низкого качества и наличием встроенных мастеров - помощников в работе; мощным встроенным текстовым редактором.

Компания Cognitive Technologies, созданная в 1993 году на базе лаборатории искусственного интеллекта Института Системного Анализа РАН, сочетает в системе распознавания текстов CuneiForm передовые технологии и результаты многолетних исследований и разработок отечественных ученых и программистов. Благодаря этому OCR CuneiForm стал одной из самых популярных в мире систем распознавания текстов. В России CuneiForm всегда задавал стандарты и новые направления развития и для других OCR-систем.

Основные возможности OCR CuneiForm

1. ИНТЕРФЕЙС
Интерфейс программы содержит выпадающие контекстные меню, панели быстрого доступа, контекстную помощь.

2. СКАНИРОВАНИЕ

* Автоматический подбор оптимальных параметров сканирования.
* Возможность импортирования отсканированных или полученных через факс-модем графических файлов во многих форматах.
* Обработка изображений: печать образа, инвертирование, поворот.

3. ФРАГМЕНТАЦИЯ

* Автоматический и полуавтоматический режимы поиска блоков текста, таблиц и графики, который обеспечивает большую гибкость при работе с многоколоночными текстами и текстами сложной структуры и с графическими элементами.
* Режим ручной фрагментации для работы с текстами особо сложной структуры.

4. РАСПОЗНАВАНИЕ

* CuneiForm распознает любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, печатной машинки, плохих ксерокопий и факсов.
* Самообучающиеся адаптивные алгоритмы распознавания повышают вероятность распознавания низкокачественных документов.

5. ЯЗЫКОВАЯ ПОДДЕРЖКА
Система распознает русский, английский, смешанный русско-английский, украинский, немецкий, французский, испанский, португальский, итальянский, голландский, датский, шведский, финский, сербский, хорватский, польский, казахский, узбекский и другие языки.

6. СЛОВАРНЫЙ КОНТРОЛЬ

* Словарь общеупотребительной лексики каждого поддерживаемого языка для контекстной проверки и повышения качества результатов распознавания.
* Возможность создания и пополнения пользовательского словаря, а также возможность экспорта/импорта словаря в/из текстовых файлов.

7. РЕАЛИЗАЦИЯ ПРИНЦИПА "What You Scan Is What You Get" ("Что Вы сканируете, то и получаете").
CuneiForm позволяет получить полную копию вводимого документа, включая:

* Шрифтовое оформление и форматирование.
* Расположение текста, иллюстраций и таблиц.
* Колонки, абзацы, отступы, стили и размеры шрифтов.
* Черно-белые, 256-градационные серые и цветные 24-битные иллюстрации в выходном RTF-файле.

8. РАБОТА С ТАБЛИЦАМИ

* Распознавание таблиц различной структуры, в том числе и без линий разграфки.
* Редактирование таблиц (уменьшение/увеличение, удаление/создание колонок и т.д.)
* Сохранение результатов в распространенных табличных форматах.

9. РЕДАКТИРОВАНИЕ
В программу встроен многофункциональный редактор, не уступающий по своим возможностям популярным текстовым процессорам.

* Одновременная подсветка распознанного текста и исходного изображения, снабженная функцией "следующий/предыдущий сомнительно распознанный".
* Поддержка иллюстраций, таблиц, колонок, колонтитулов, сложного форматирования и различных шрифтов.
* Возможность редактирования текстовых документов популярных форматов.

10. ИНТЕГРАЦИЯ С ДРУГИМИ ПРИЛОЖЕНИЯМИ
Опции командной строки и поддержка Drag&Drop для вызова из внешних приложений, сканирования, распознавания и сохранения результатов в автоматическом режиме.

Комментариев нет: