http://ITWare.com.ua/news/17598/

3 октября 2007 г

ABBYY представила FineReader 9

Компания ABBYY представила новую версию популярной OCR-системы FineReader

Новая система распознавания текстов имеет ряд инновационных обновлений. В первую очередь, это технология адаптивного распознавания документов (ADRT). Она позволяет обрабатывать весь документ как единое целое. (тогда как предыдущее поколение OCR-систем обрабатывало каждую страницу в отдельности, что занимало больше времени и с большей вероятностью приводило к ошибкам).

Технология ADRT обеспечивает большую точность конвертирования документов, изображений и PDF-файлов в форматы Microsoft Word и Microsoft Excel. Рассматривая документ во всей его целостности, программа, подобно человеку, определяет различные
части его структуры, такие как заголовок, основной текст, колонки, таблицы, изображения и номера страниц.

FineReader 9.0 воссоздает оформление распознанного документа, используя соответствующие элементы разметки из арсенала Microsoft Office, например, такие как: колонтитулы, сноски, колонки текста, нумерация страниц, подписи к картинкам и диаграммам. Программа определяет похожие элементы документа на разных страницах и использует для каждой такой группы элементов одинаковые шрифты и стили шрифтов (поддерживаются как стили абзацев, так и отдельных символов).

Система автоматически определяет язык документа и может работать со смешанным текстом, содержащим комбинации из 36 языков, имеющих словарную поддержку в ABBYY FineReader.

По заверениям разработчиков, в новой версии точность распознавания документов повысилась на 35%, точность сохранения форматирования — на 32%, а полностью переработанный интерфейс программы и наличие готовых сценариев работы позволяет совершать типичные операции выполняя на 40% меньше манипуляций с интерфейсом.

Программа также содержит возможности, позволяющие узнавать печати и подписи в договорах. В распознанном документе эти элементы отображаются как графические изображения, на не горы текстового мусора вследствие неправильного распознавания.

Еще одна интересная возможность — распознавание изображений, сделанных с помощью цифровой камеры (Digital Camera OCR). Используемые алгоритмы позволяют компенсировать даже существенные изгибы листов текста (например, на фотографиях журнальных или книжных страниц). По заверениям разработчиков, система уверенно распознает снимки страниц А4 сделанные на камеру с матрицей 5МП (в максимальном разрешении), однако на практике могут быть распознаны и снимки сделанные на 2МП камерофон.

Версия Professional доступна в Украине уже сегодня по цене 648 грн (в ближайшее время также появится украинская локализация, бесплатная для владельцев легальных копий). Корпоративная версия появится несколькими месяцами позже по цене порядка 1250 грн. Пользователи, которые до этого времени приобретут FineReader 8.0 Corporate Edition, смогут обновить программу до 9 версии за символическую сумму, которая, однако пока не оглашается.