30 сентября 2003 г.
Рынок систем оптического распознавания текстов очень изменился за последние годы. Что же здесь происходит? Об этом √ в интервью с директором представительства ABBYY в Украине Виталием Тищенко.
Совсем недавно состоялась мировая премьера новейшей разработки компании ABBYY √ системы оптического распознавания текстов √ FineReader 7.0. Что интересно, Украина по объему этого рынка сейчас находится среди лидеров в странах Восточной Европы. Кроме того, системы оптического распознавания текстов с момента выпуска первого продукта претерпели колоссальные изменения, касающиеся многих аспектов их позиционирования на рынке. Об этом √ в интервью с директором представительства ABBYY в Украине Виталием Тищенко. Стоит отметить, что, закончив факультет кибернетики Киевского государственного университета им. Т. Шевченко в 1994 году, именно он буквально через год по предложению Сергея Андреева (бывшего исполнительного директора BitSoftware, а ныне √ генерального директора ABBYY) возглавил команду единомышленников и открыл первое международное представительство этой российской компании в Киеве.
ITware: Виталий, недавно вышла уже седьмая версия FineReader. Как вы считаете, каковы главные причины популярности систем оптического распознавания текстов?
В. Т.: Если говорить о глобальных причинах, то, как мы видим, бумажные технологии в документообороте до сих пор "не умерли". Но ими, как и раньше, пользоваться менее удобно, чем информацией в электронном виде. Поэтому потребности пользователей переводить документы из бумажного вида в электронный со временем только возросли. Кроме того, появилась также возможность превращать в редактируемые файлы информацию из графических изображений, например, полученную факс-модемной программой или загруженную из Интернета в виде PDF-файла.
Стоит также отметить, что системы оптического распознавания сейчас намного совершенней, чем раньше, и ими стало очень удобно пользоваться. Это один из немногих примеров, когда продуктом, на разработку которого ушли годы кропотливой работы и проводились глубокие теоретические исследования, можно пользоваться через несколько минут после ознакомления. Именно поэтому системы оптического распознавания очень популярны на рынках не только профессиональных, но и массовых пользователей.
ITware: В каких рыночных сегментах вы сегодня работаете?
В. Т.: На сегодняшний день мы работаем в сегментах как настольных систем распознавания текстов (печатный текст переводится в электронный вид), так и систем интеллектуального распознавания рукописных текстов (машиночитаемые формы заполняются от руки и затем текстовая информация из них извлекается для сохранения в базе данных).
К первому сегменту относится настольная система распознавания текстов ABBYY FineReader. Ко второму √ программный продукт для обработки форм ABBYY FormReader, который весьма эффективен, например, при проведении каких-то массовых мероприятий, где требуется внести в компьютер массу данных, которые получены с разных носителей текстовой информации (анкетирование, голосование, перепись населения, выборы, различного рода маркетинговые мероприятия и т. п.).
ITware: А не выгоднее ли использовать труд людей-наборщиков текстов вместо оптической системы распознавания?
В. Т.: Дело в том, что скорость ввода печатных текстов через систему оптического распознавания на несколько порядков выше, чем скорость ручного ввода информации оператором ПК. Кроме того, система распознавания рукописных данных еще на начальном этапе может указывать и исправлять ошибки при вводе информации: (неточности в названиях улиц, городов и т. д., что заранее известно).
Стоит также отметить, что такого плана работа, как правило, носит сезонный характер. Это значит, что нужно было бы приглашать на работу персонал, а также закупать необходимое оборудование на непродолжительное время, что весьма неэффективно для работы любой организации.
ITware: Как влияет на качество распознавания текстов оборудование, которым управляет ваше ПО?
В. Т.: Влияет, и очень здорово. Когда на распознаваемой поверхности системе нужно вычленить значащие элементы текстовых конструкций, сразу становится понятно, что эта поверхность должна быть четко переведена в цифровой вид для последующей обработки. Стоит учесть, что программа работает с уже отсканированным изображением. Поэтому от применяемого сканера, качества и режима сканирования тоже зависит качество работы OCR-системы.
Современные системы оптического распознавания, как правило, справляются даже с чрезвычайно сложными задачами с большой эффективностью, так как способны обработать различные оттенки серого цвета и цветные изображения, чтобы вычленить из общего фона отдельные буквы и слова.
ITware: Но вы работаете, как я понял, не только на корпоративном рынке?
В. Т.: Конечно же, спектр применения нашего ПО достаточно широк. Это не только крупные корпорации и государственные организации (перевод документооборота в цифровой вид и обратно), но и средний и малый бизнес, домашние пользователи (перевод в цифровой вид журналов, газет, листовок, визиток и т. п.), а также компании, которые встраивают нашу систему в собственное программное обеспечение или оборудование.
ITware: Виталий, а вы сами используете вашу систему?
В. Т.: Все входящие важные бумажные документы мы переводим в цифровой вид. Затем мы можем их обсуждать коллективом сотрудников, находящихся в разных городах и странах.
Информация из прессы тоже, как правило, переводится нами в цифровой вид.
Кроме того, это ПО очень часто используется ABBYY на различного рода семинарах и конференциях, где происходит анкетирование участников и другие маркетинговые мероприятия.
ITware: Какова цена ваших продуктов и окупится ли их применение?
В. Т.: Рекомендованная розничная цена для стран Восточной Европы на ABBYY FineReader 7.0 Professional Edition составляет $129 (обновление для пользователей предыдущих версий программы - $89), сетевая версия продукта √ ABBYY FineReader 7.0 Corporate Edition стоит $259 (обновление для пользователей предыдущих версий - $179). Хотелось бы отметить, что системы для обработки форм ABBYY FormReader дороже, но их внедрение быстро окупается, как только появляется потребность ввода большого объема информации, особенно в ограниченные сроки.
ITware: FineReader многие пользуются уже много лет. Когда и как началась история этого продукта?
В. Т.: Наша компания начала работать в Украине с 1995 года, представив широкой публике вторую версию FineReader, которая могла распознавать только два языка √ русский и английский. В 1996 году была выпущена третья версия, в которой появилась возможность распознавания украинских текстов. Четвертая версия, вышедшая в 1998 году, уже стала многоязычной. А качество распознавания было таким, что мы уже побеждали в международных тестах, проводимых для таких систем.
ITware: Если системы оптического распознавания текстов столь популярны, почему на рынке так мало конкурентных разработок?
В. Т.: У нашего продукта с самого начала нашей деятельности в Украине практически не было серьезных конкурентов, в отличие от рынков России и стран Восточной и Западной Европы.
В Украине FineReader стал стандартом де-факто для систем распознавания текстов. К интерфейсу и высокому качеству нашей системы все привыкли, и нужны очень веские причины для того, чтобы перейти на конкурентный продукт.
Что касается рынков стран Восточной Европы, то когда мы только начинали там работать, у нас была жесткая конкурентная борьба с другими компаниями.
У нашей фирмы самые сильные позиции в Украине и России. В странах Восточной и Западной Европы чуть хуже, но √ все равно мы контролируем более 60 % рынка основных стран Восточной Европы √ Польши, Чехии, Словакии.
Что же касается США, то там по объему рынка нас пока обходит ScanSoft, однако в России и Украине продуктов этой компании практически не наблюдается.
ITware: ScanSoft не интересен украинский рынок из-за сравнительно малых объемов реализации такого рода продуктов?
В. Т.: Наш рынок не так уж мал. Например, по абсолютным показателям он занимает второе место в странах Восточной Европы, уступая лишь Польше. А по относительным показателям Украина значительно опережает остальные страны в своем регионе.
Другое дело, что по абсолютным цифрам рынок США существенно больше.
ITware: В каких странах сегодня работает ваша компания?
В. Т.: В зону ответственности "ABBYY Украина" входят рынки стран Восточной Европы, а также Израиль, Мальта, Кипр и Турция.
Офис в Мюнхене (ABBYY Europe) отвечает за страны Западной Европы. Офис в США (ABBYY USA) √ за продажи в Северной и Южной Америке, мировые контракты с производителями сканеров, а также за некоторые страны Азии. Кстати, ежегодно в мире продается около 9 млн устройств, комплектующихся нашими системами.
Головной же офис нашей компании находится в Москве √ он координирует работу всех офисов, а также занимается продажами в других странах мира.
ITware: Могли бы вы выделить какие-то особенные черты других рынков, где работает ваша компания?
В. Т.: Например, в США много компаний работают на рынке программных разработок, включая в свои продукты системы оптического распознавания текстов. В результате объем продаж средств разработки весьма велик. Похожая ситуация наблюдается и в странах Западной Европы.
В зоне нашей ответственности и в России лучше продаются готовые системы обработки форм.
Что же касается настольных систем, то срез пользователей меняется "Востока на Запад" - доля продаж версии Corporate Edition в общих продажах выше всего в России, несколько меньше у нас и существенно меньше в Польше. Дело в том, что в Украине и России большую покупательскую активность проявляют организации, что и обуславливает более высокий спрос на сетевую версию продукта. А в таких странах, как Польша, Чехия или Венгрия, первенство покупательской активности принадлежит пользователям, которым продукт нужен для индивидуального применения, т. к. обычные граждане имеют большую покупательскую способность и также уровень пиратства ниже по сравнению с нашим.
ITware: Рынок систем оптического распознавания текстов быстро развивается. Каков ваш прогноз в этой сфере?
В. Т.: Еще пять лет назад актуальной для многих являлась проблема качества распознавания текстов. Сейчас более важна точность воспроизведения распознаваемого текстового документа в деталях (с сохранением шрифтов, стилей, графических изображений, структуры, формы, и т. п.). Кроме того, многих заказчиков интересует возможность работы с продуктом по сети или в Интернете.
Также в последней версии ABBYY FineReader, если вы заметили, особое внимание нами уделено работе с документами в популярном формате PDF.
Стоит отметить, что наш продукт все более становится интересным в составе других систем (аппаратных и программных). Поэтому от него требуется возможность более легкого встраивания в другие разработки.
Если говорить о более дальних перспективах развития этого рынка, то, я думаю, что появятся более узкие "специализированные" решения, включающие часть распознавания и более точно соответствующие потребностям того или иного рынка.
Что же касается рынка Украины, то здесь до сих пор не заполнена в полном объеме ниша центров сканирования. Центры или бюро сканирования √ это структуры, которые оказывают услуги по вводу данных с использованием технологий сканирования и распознавания. Думаю, в ближайшем будущем такие центры будут создаваться, ведь их услуги востребованы.
|