Прошлые поколения оставили нам не столько готовые решения вопросов, сколько самые вопросы.

Сенека

 

Связь с редакцией
Рассылка новостей

Чем полезны облака при организации потокового ввода документов и данных

02.04.2013 14:56

Автор: Арам Пахчанян, вице-президент, директор департамента продуктов для ввода данных компании ABBYY

Построение надежного и качественного процесса по извлечению информации из бумажных документов для последующего ее использования в информационной системе – важная задача для любого современного предприятия. Автоматизация этого процесса, возможная за счет применения решений на основе OCR- и ICR-технологий, позволяет значительно сократить время ввода документов и использование ручного труда, повысить точность вводимых данных за счёт сведения к минимуму ошибок, связанных с человеческим фактором, эффективнее расходовать время сотрудников. В результате все это способствует уменьшению суммарных затрат предприятия на обработку документов.

При этом само по себе распознавание, необходимое для извлечения данных, – очень ресурсоемкий процесс, требующий значительных вычислительных мощностей на стороне предприятия, использующего OCR. И существуют сценарии, когда компании не выгодно устанавливать эти мощности у себя. Например, для оцифровки за короткий срок огромного бумажного архива потребуется покупка большого количества серверов для распознавания, которые затем окажутся не нужны, так как их мощности будут избыточными для выполнения регулярной задачи по добавлению в электронный архив новых данных. С похожей проблемой могут столкнуться также компании или организации, работа которых связана с сезонным фактором. Оборудование, необходимое для того чтобы справиться с пиковыми нагрузками может простаивать в межсезонье, или, наоборот, в самый разгар бизнес-сезона может выясниться, что текущих мощностей не хватает, а времени на оперативное исправление ситуации может не оказаться. И наиболее правильным решением для автоматизации ввода документов и данных в таких условиях будет использование облачного сервиса распознавания. Ведь технология Cloud Computing как раз и создана для того чтобы легко справиться с такого рода неприятностями за счет целого ряда преимуществ:


- Гибкость и масштабируемость.

Облачный сервис может оперативно реагировать как на краткосрочные изменения нагрузки, например, вызванные сезонным всплеском, так и на долгосрочные, связанные с ростом самого предприятия и его потребностей. Это возможно благодаря тому, что облачная платформа позволяет сервису при необходимости за минуты отмасштабироваться до нужных размеров, что в нашем случае означает запуск распознавания документов на таком количестве вычислительных ресурсов, которое необходимо для обработки в кратчайшие сроки.

- Отсутствие единоразовых капитальных вложений.

Использование облачного сервиса не требует покупки новых вычислительных мощностей, так как самая ресурсоемкая часть – обработка данных, а в нашем случае распознавание – будет выполнена на облачных серверах. При этом в традиционной модели ИТ внедрение нового сервиса или нового производственного процесса, чаще всего, ассоциируется с капитальными затратами на инфраструктуру, обеспечивающую его работу. И каждый руководитель, имеющий дело с ИТ-инфраструктурой компании, знает, что покупка дополнительного оборудования также сопряжена и с новыми косвенными расходами: это и новые человеческие ресурсы, необходимые для отлаживания нового оборудования, и дополнительные площади для размещения, и, конечно же, время, которое будет затрачено на всю процедуру развертывания новой инфраструктуры. И особенно неприятна ситуация, когда такие ресурсы нужны для разовой задачи. А облачные сервисы позволяют избежать всех этих трат.

-  Стоимость услуг.

Если вы работаете с облачным сервисом, то никто не будет выставлять вам счет за аренду помещения, в котором простаивает незагруженное оборудование, или за электричество, которое оно потребляет. Вы платите только за то, что используете и только тогда, когда услуга вам необходима. Сколько страниц в месяц вам надо обработать, за столько и заплатили, и только тогда когда вам это надо, надо больше – заплатили больше.

- Совместимость и доступность.

Чаще всего, облачные сервисы, и наш сервис ABBYY Cloud OCR SDK, предоставляющий доступ к технологиям оптического распознавания текста, меток и штрихкодов посредством Web API, в том числе, доступны в любой точке мира, из-под любой операционной системы и с любого устройства, имеющего выход в интернет. Это позволяет решать проблему совместимости и доступности, а попутно, еще и очень необычные задачи, например, такие, как ввод данных в информационную систему предприятия с помощью камеры мобильного устройства. Вычислительные ресурсы современных смартфонов и планшетных компьютеров велики, но пока не позволяют напрямую запускать на них полноценное распознавание, поэтому есть 2 выхода: либо использовать облегченную версию технологии распознавания, установленную на мобильном устройстве, либо выносить обработку изображения в облако. При этом использование варианта с облаком позволит достичь максимального качества распознавания.

Конечно, существуют и факторы, сдерживающие развитие облачных сервисов. Прежде всего, это недоверие компаний к обработке данных в облаках из-за страха перед различными угрозами информационной безопасности, прежде всего, потерей контроля над конфиденциальными данными. Но стоит отметить, что когда поставщиком облачной платформы выступает такая крупная и уважаемая компания как Microsoft, Amazon или Google, то за сохранность данных и соответствие требованиям законодательства беспокоиться приходится в меньшей степени. Например, компания ABBYY после предварительного анализа выбрала Windows Azure в качестве облачной платформы для всех наших сервисов. Также, в пользу большей безопасности данных при использовании облака по сравнению с вариантом их хранения внутри предприятия говорит еще и тот факт, что облачные системы защищают большие команды профессионалов, в то время как не каждое предприятие может позволить себе профессионального специалиста по ИТ-безопасности, хорошо владеющего самым последним арсеналом борьбы с угрозами.

Помимо этого в некоторых регионах России, как и во многих других странах, есть места, в которых отсутствует доступ к высокоскоростному интернету, что также является сдерживающим фактором для использования облачных технологий на предприятиях. Но это временный фактор, значимость которого будет снижаться вместе с дальнейшим распространением широкополосного интернета в нашей стране. Существуют еще риски, связанные с потерей данных или перерывами в предоставлении услуги по вине интернет-провайдера, но они достаточно легко разрешаются за счет резервирования и кэширования данных.

В заключении отмечу, что с похожими рисками можно столкнуться и при использовании традиционной модели ИТ: и оборудование может выходить из строя, и персонал допускает ошибки, и угроз из вне, направленных на несанкционированный доступ к конфиденциальной информации, становится все больше. Поэтому, какой бы вариант для автоматизации ввода данных из бумажных документов в информационную систему предприятия ни был бы выбран, я бы советовал оценить какие в вашем случае плюсы облачной или традиционной модели важнее и следовать «лучшим практикам» для вашей отрасли.

www.abbyy.com ; www.abbyy.ru

 

Мнение специалиста

Адрес редакции: 117997, Москва, Профсоюзная ул., д. 65, оф. 360
Телефон: (926) 212-60-97.
E-mail: info@avtprom.ru или avtprom@ipu.ru

© ООО Издательский дом "ИнфоАвтоматизация", 2003-2024 гг.

РассылкиSubscribe.Ru
Автоматизация в
промышленности