2021/12/27 15:04:10

Как в ВТБ Лизинг выбирали инструмент OCR-распознавания и какие цифровые кейсы он позволил реализовать

ВТБ Лизинг запускает новые цифровые проекты, связанные с переходом бизнеса в онлайн. Компания планирует создавать новые продукты, опираясь на современные технологии, такие как OCR, с использованием искусственного интеллекта. Процессу выбора OCR-движка с учетом широкого спектра предъявляемых к нему требований посвящена эта статья.

Содержание

«
Одним из важных приоритетов развития бизнеса ВТБ Лизинг сегодня является перевод услуг автолизинга в цифровую среду, - рассказывает Константин Есюнин, главный архитектор ВТБ Лизинг. – Для этого создается омниканальная платформа ЭЛИЗА – современное решение электронного лизинга (e-leasing), позволяющее реализовать безбумажную лизинговую сделку. В рамках этого направления идет работа над рядом микросервисов, в частности, сервисом распознавания текстов на основе технологии OCR (Optical Character Recognition)».
»

Несмотря на то, что продукты OCR давно существуют на рынке, выбор подходящего решения оказался непростой задачей в силу ряда особенностей процессов ВТБ Лизинг

Процесс лизинговой сделки имеет сложную структуру и включает, в том числе, работу с большим количеством разнообразных документов, имеющих юридическую значимость. В идеале ЭЛИЗА должна уметь работать со всем объемом документации в электронном виде, причем с минимальными задержками в обслуживании для пользователей. Это подразумевает особые требования к OCR-решению, которое должно обрабатывать документы в контексте лизинговых сделок - как бумажные, так и те, что изначально создаются в электронной форме.

В поиске наилучшего инструмента распознавания текстов

Несмотря на то, что продукты OCR давно существуют на рынке, выбор подходящего решения оказался непростой задачей в силу ряда особенностей процессов ВТБ Лизинг. Нужное компании решение должно было представлять собой web-приложение, использующее актуальные библиотеки разработки, а кроме того, отвечать списку технических требований. Так, пользовательский интерфейс (UI) должен соответствовать брендбуку компании. Например, обеспечивать возможность стилизации среды под дизайн, используемый ВТБ Лизинг (цветовые гаммы, логотипы, шрифты, элементы управления), для того чтобы его можно было интегрировать в интерфейсы CRM, личный кабинет клиента, мобильное приложение и другие системы-абоненты.

Требовалось также реализовать широкий спектр функционала ролевых моделей: от административного интерфейса управления пользователями и их ролями до ролевой модели доступа к функционалу, интерфейсу, настройке параметров системы распознавания и автосравнения, отдельным сущностям в рамках OCR. Подразумевалась возможность разграничения уровня доступа на просмотр/редактирование/подтверждение изменений.Игорь Лейпи, ГК Softline: Объем поставок российских операционных систем в ближайшие годы увеличится как минимум вдвое

Нужно было обеспечить заведение пользователей, их аутентификацию и авторизацию через Active Directory, LDAP, непосредственно в системе, а также реализовать интерфейс логирования действий пользователей и интеграционных процессов с отображением отчетов на дашбордах.

С точки зрения технической реализация предполагался вариант on-premise. Компания не рассматривала облачные продукты – решение OCR должно устанавливаться на вычислительных мощностях лизинговой компании.

Важнейший перечень требований относился к поддержке обработки структурированных и неструктурированных документов. Например, паспорт гражданина РФ или счет-фактура имеют четкую структуру, которую можно разметить для распознавания по пикселям расположения необходимого объема информации в той или иной области документа. Для их распознавания на рынке предлагается ряд уже готовых и проверенных временем решений. Однако многие документы, с которыми работает ВТБ Лизинг, имеют нечеткую структуру, меняющую содержимое документов в зависимости от различных условий.

«
Яркий пример – договоры купли-продажи с поставщиками автомобилей. Их у компании больше 4 тысяч, - поясняет Константин Есюнин, - и у каждого своя форма договора, причем, в двух или трех вариантах. Всего выходит более 8 с лишним тысяч вариаций одного только договора купли-продажи. При этом OCR-решение должно автоматически распознавать тип документа и к какому партнеру он относится, и на основании этого находить необходимые бизнес-сущности/атрибуты для их последующей передачи в систему CRM.
»

Специальные требования по обработке неструктурированных текстов включали:

  • Автоматическое выявление в документах бизнес-сущностей.

Для автоматизации процессов важно не только распознать текст документа, но и выявить в нем нужные атрибуты: реквизиты контрагента, стоимость и параметры автомобиля, данные о полномочиях подписантов и т.д., и затем передать эти данные в системы-абоненты. В среднем из разных документов извлекается от 5 до 15 атрибутов примерно для 40 размеченных типов документов.

  • Сравнение документов.

Эту работу традиционно выполняет человек-верификатор – сравнивает документ, отправленный контрагенту на подпись, с подписанным вариантом. Это необходимо, поскольку на рынке, к сожалению, встречаются недобросовестные партнеры, которые пытаются незаметно внести изменения в текст договора на этапе подписания, фактически фальсифицируя согласованный документ. Обычно человек сравнивает документы, опираясь на перечень формальных требований, заданных в инструкции проверки, - это проверка конкретных пунктов документа с динамическими значениями. При этом верификаторы не проверяют текст, который является статичным и невариативным. Заменяющая работу человека информационная система должна уметь самостоятельно определить тип документа и перечень элементов текста конкретного типа, чувствительных к изменениям, например, увеличение количества страниц в документе, отрыв реквизитов сторон от предыдущего текста, добавление / удаление текста и т.п.

  • Автоматическая верификация обязательных сведений.

Верификация документа – это рутинная работа, включающая, например, проверку наличия подписей сторон на каждой странице, наличия в нужных местах печати, штампа. Ее можно и нужно передавать автоматизированной системе.

«
Такие задачи по силам только OCR-решениям с искусственным интеллектом. Причем популярные системы полнотекстового поиска, которые умеют парсить текст документа и искать в нем заданные комбинации слов, здесь не помогут, - подчеркивает Константин Есюнин. - Требуется встроенный механизм Machine Learning с постоянно обучаемыми и совершенствующимися моделями. Это требование существенно сокращает возможности выбора нужного OCR-решения.
»

При этом, продолжает главный архитектор ВТБ Лизинг, OCR-решение должно быть универсальным – уметь встраиваться в любую ИТ-систему, работающую с документами. Еще одно существенное требование - экономическая эффективность.

ИТ-продукт с искусственным интеллектом – это всегда недешевое удовольствие. А системы распознавания текстов обычно требуют еще и отдельного лицензирования OCR-движка.

«
Стоимость лицензии зависит от количества обрабатываемых страниц текстов, - рассказывает Константин Есюнин. – И это критично для лизинговых сделок, которые требуют нескольких многостраничных документов. Цена владения таким ИТ-решением оказывается не только слишком высокой, но и имеет очень длительный срок окупаемости.
»

По сути требовалось найти такое OCR-решение, которое сможет обеспечить все вышеописанные технические требования при минимальных операционных затратах, более низких или сопоставимых с ручной работой сотрудников. И такое решение было найдено: партнером ВТБ Лизинг по направлению микросервиса OCR стала компания–разработчик, предложившая не только высокий технологический уровень продукта, но и лояльную политику расчета стоимости пользования им.

Фактически разработчик приступил к созданию ИТ-решения, кастомизированного непосредственно под требования ВТБ Лизинг, поясняет Константин Есюнин. Причем лизинговая компания становится совладельцем исходного кода.

Особенности микросервиса OCR

Решение, которое внедряется в ВТБ Лизинг, является универсальным приложением. С точки зрения реализации оно представляет собой веб-сервис с собственным интерфейсом пользователя (UI), который может при необходимости начать работать с любой информационной системой компании. Вместе с CRM в первичный список таких систем входят, в частности, личный кабинет клиента на корпоративном сайте и мобильное приложение.

Важный элемент решения – проверка качества данных. Дело в том, что оптическое распознавание текста может производиться с некоторой погрешностью, например, та или иная буква может быть распознана с ошибкой и пропущена в финальном тексте. В таких случаях OCR-решение ВТБ Лизинг с помощью встроенного механизма искусственного интеллекта и доступных корпоративных справочников способно «додумать», какой символ был пропущен, и восстановить исходный текст.

Эта задача еще больше усложняется при обработке документов, использующих рукописный текст. Например, в паспортах некоторые сведения могут быть заполнены от руки. Очевидно, что 100% распознавания текстов всех документов добиться невозможно, но система радикально сокращает нагрузку человека-верификатора, так как на ручную проверку попадают только те документы, с которыми OCR-программа не смогла справиться самостоятельно.

Управление работой верификаторов напоминает работу сотрудников контакт-центра. Все задачи на распознавание и сравнение документов имеют определенный норматив времени обработки: от момента, когда OCR-система передала документ на верификацию человеку, до ввода в систему проверенных человеком данных. При этом OCR-система собирает сведения о процессах ручной верификации в единый отчет. Это, в частности, помогает увидеть, какие задачи оказываются сложными для автоматической обработки, с какими типами документов это связано и какие типы ошибок электронной системы чаще всего встречаются.

«
Это важная информация для того, чтобы переобучить модель распознавания, - отмечает Константин Есюнин.
»

Бизнес-кейсы для внедрения OCR-решения

На первом этапе проекта реализуется ряд наиболее востребованных бизнес-кейсов использования микросервиса OCR:

Лидогенерация

Клиент может обратиться в компанию за лизингом автомобиля по различным каналам: мобильное приложение, личный кабинет, лендинг, сайт ВТБ Лизинг. В ближайшем будущем будет добавлен канал кросс-продаж через «ВТБ Онлайн». Когда человек нажмет на кнопку «Оформить заявку на автомобиль в лизинговой компании», необходимо произвести быстрый скоринг потенциального клиента, а также построить дальнейшее взаимодействие с ним таким образом, чтобы сделка совершалась в течение нескольких часов.

Для этого необходимо, чтобы, во-первых, он предоставлял в компанию как можно меньше документов. Во-вторых, те документы, которые клиенту все-таки придется предоставить, например, паспорт, должны обрабатываться OCR-системой на скорости, близкой к реальному времени.

Сегодня для быстрого скоринга используется 28 внешних источников данных: ФНС, ЕГРЮЛ, ЕГРИП, бюро кредитных историй, арбитражи.

«
Располагая только ИНН контрагента, можно получить очень много полезной информации о нем, - замечает Константин Есюнин.
»

Помимо сканирования паспорта, клиент должен собственноручно подписать соглашение об обработке персональных данных, ведь по закону для обращения в Бюро кредитных историй (БКИ) требуется согласие клиента в бумажной форме и с физической подписью.

На нынешнем этапе гибридных электронно-бумажных коммуникаций с клиентами процессы лидогенерации включают различные нетривиальные элементы, как использование простой электронной подписи (ПЭП) для юридически значимых документов, а также фотографии листа с личной подписью, которая прикладывается к соглашению о персональных данных (СОПД) для БКИ. Распознавание СОПД и соглашения для БКИ также реализовано в интерфейсе OCR.

Распознавание коммерческих предложений большого количества поставщиков

Из тысяч вариантов коммерческих предложений от поставщиков автотранспортных средств, с которыми клиенты обращаются в лизинговую компанию, система OCR автоматически извлекает более 20 бизнес-сущностей, существенных для заключения договора лизинга: марка, модель автомобиля, стоимость, дата предложения, наименование поставщика, размер скидки, мощность и объем двигателя, тип коробки передач и другие параметры. Все извлеченные из предложения атрибуты автоматически подставляются в интерфейс лизингового калькулятора для последующего расчета графика платежей. Пользователю уже нет необходимости вводить их вручную.

Сравнение любого подписанного документа с оригиналом

Один из важных этапов бизнес-процессов лизинговой сделки – получение от клиента подписанного документа, который поступает либо по электронной почте, либо в бумажном виде добавляется на обработку менеджером, либо в цифровом виде - через операторов электронного документооборота. В этот момент запускается задача верификации документа: система OCR сама находит исходный шаблон, оригинал документа и сравнивает его с тем, который поступил от клиента.

«
Все выявленные расхождения в тексте имеют разный «вес», скажем, лишний пробел – это некритическое замечание, а вот отсутствие запятой в цифре – критически важный момент. Система сама оценивает величину погрешности расхождений между двумя документами, учитывая, в том числе, тип документа. И если она превышает пороговое значение, передает документы на ручную верификацию. В электронный архив документ всегда отправляется только в верифицированном виде, - замечает Константин Есюнин.

»

Проверка параметров доверенности

В доверенностях, связанных с лизинговыми сделками, могут быть существенные расхождения с другими документами. Например, сумма, указанная в доверенности, оказывается меньше стоимости договора. Или доверенность выдана на определенный срок, который уже завершился. OCR-система автоматически проверит существенные параметры доверенности и, если найдет ошибки, сформирует соответствующее оповещение о том, что доверенность просрочена или подписант не уполномочен подписывать договоры выше лимита.

Проверка соответствия рыночной цене

На момент заключения лизинговой сделки необходимо знать рыночную стоимость автомобиля, чтобы исключить ситуацию неправомерного завышения или занижения его цены партнерами по сделке. Традиционно для этой цели сотрудник вручную проводит целое рыночное исследование. Это время еще больше увеличивается, если речь идет об автомобиле премиум-класса, когда в расчете необходимо учесть множество дополнительных опций, оказывающих влияние на окончательную стоимость. OCR-система, используя модуль «Справочник транспортных средств», извлекает из коммерческого предложения необходимые сведения и передает их на обработку другому микросервису, который определяет рыночную стоимость автомобиля на основании распознанных атрибутов. В случае существенного расхождения предлагаемой цены со среднерыночной на экране сотрудника появляется соответствующее предупреждение.

Текущий этап создания универсального OCR-сервиса

Описанные выше возможности OCR-сервиса реализованы в виде программного продукта, который в данный момент проходит опытно-промышленную эксплуатацию.

«
И это только первый шаг на пути внедрения нашего сервиса. Впереди еще шесть этапов, - рассказывает Константин Есюнин.
»

Согласно планам развития, в нынешней фазе система будет распознавать около 40 видов документов.

«
Главная задача запуска микросервиса OCR - ускорение прохождения лизинговой сделки от момента лидогенерации до формирования договора и проверки сопутствующих документов. В целом это должно существенно ускорить работу мидл- и бэк-офиса, - говорит Константин Есюнин. - Например, для операции распознавания паспортных данных установлен норматив в несколько секунд.
»

За это время данные должны быть не только распознаны, но и перенесены в систему CRM: если клиент заходит в личный кабинет и выкладывает скан паспорта, то время отклика системы для продолжения коммуникации составляет менее 10 секунд.

«
Счет идет именно на секунды. Даже если в обработку поступают какие-то очень «тяжелые» документы, - подчеркивает Константин Есюнин и продолжает: Понятно, чем умнее будет становиться с течением времени модель распознавания, тем быстрее данные, извлеченные из документов, будут поступать в CRM и затем проходить процедуру скоринга с помощью еще нескольких микросервисов.
»

Ожидается, что после того, как клиент подгрузит в систему снимок паспорта, он за минимальное время получит одобрение сделки и договор для подписания.

«
А в идеале за эти считаные минуты договор будет одобрен, клиент его подпишет, например, с помощью электронной подписи, затем заберет автомобиль в салоне или получит доставкой по указанному адресу, сядет в машину и поедет, довольный, по своим делам. Это то, к чему мы стремимся, - рассказывает Константин Есюнин.
»

«
Для того чтобы система могла научиться распознавать документы качественно и достоверно, совместно с бизнес-пользователями мы собирали датасеты от 100 до 1000 документов, а также составляли бизнес-кейсы, – рассказывает Дмитрий Гусев, менеджер проекта OCR.

»

Очевидно, что идеальных показателей сразу после запуска системы достичь не удастся, поскольку механизм распознавания документов на основе искусственного интеллекта требует времени для обучения моделей. Это значит, что чем больше документов будет распознавать OCR, тем более точным будет становиться само распознавание. Заданный целевой уровень точности - 99,8%.

«
В этих условиях можно будет полномасштабно доверять результатам автоматической работы системы, - рассказывает Константин Есюнин. - И мы уже прошли определенный путь к этой цели: умеем работать с документами по нескольким сценариям обработки и будем продолжать развивать решение интеллектуального распознавания новых документов в наших бизнес-процессах.
»