Проект

РЖД создаёт нейросеть, которая наведёт порядок в разрозненной нормативной документации

Заказчики: Российские железные дороги (РЖД)

Москва; Транспорт

Продукт: Искусственный интеллект (ИИ, Artificial intelligence, AI)

Дата проекта: 2021/10 — 2022/10
Бюджет проекта: 174 427 500 руб.
Технология: Big Data
подрядчики - 201
проекты - 571
системы - 226
вендоры - 184
Технология: Data Mining
подрядчики - 235
проекты - 794
системы - 276
вендоры - 194
Технология: Data Quality - Качество данных
подрядчики - 181
проекты - 963
системы - 59
вендоры - 40
Технология: Робототехника
подрядчики - 252
проекты - 484
системы - 479
вендоры - 358

В РЖД решили создать систему разработки, интеллектуального поиска и содержательного анализа нормативных документов с использованием нейросетей. Компания 31 августа 2021 года объявила тендер на разработку такой системы с максимальной ценой контракта в 174,4 млн рублей[1].

Предпосылками для проекта послужили выявленные проблемы. В опубликованной РЖД документации к тендеру сказано, что в компании насчитывается более 25 тыс. нормативных документов, управляемых внутренними информационными системами. Однако их функционал в современных реалиях не позволяет эффективно обеспечивать управление нормативной документацией в РЖД, т.к. эти системы обеспечивают лишь часть ее жизненного цикла: согласование проектов документов, их утверждение, архивацию и хранение.

Проблема эффективного управления нормативной документацией в компании также связана с «самостоятельностью» применяемых систем и отсутствием связи между ними. Поэтому сотрудники при разработке документов осуществляют поиск необходимой информации в каждом из источников по отдельности. При этом применяемые в РЖД системы по управлению нормативной документацией не имеют современных инструментов поиска и анализа текстовой информации (естественной обработки языка, natural language processing).

Единая система, которая позволила бы вести управление жизненным циклом нормативной документации в РЖД пока отсутствует (фото - "Известия"/Александр Казаков)
«
Другой немаловажной проблемой эффективной работы с нормативной документацией в РЖД является отсутствие автоматизации выявления дублирования и противоречий в имеющихся и разрабатываемых документах, что приводит к значительным трудозатратам работников компании при поиске вручную всех документов, по конкретному вопросу, и сопоставлении разногласий между рассматриваемыми документами, - говорится в документации к закупке. - Данный подход имеет высокий риск неполного охвата анализируемой документации и учета всех параметров в ней, что может в дальнейшем привести к рассогласованности в деятельности структурных подразделений холдинга РЖД.
»

«Узкими» местами процесса разработки нормативных документов РЖД является также использование классического подхода к разработке документов, включающего локальное создание документа, загрузка в систему электронного документооборота, сбор замечаний, повторение итераций согласования, и отсутствие «единого окна» для поиска и изучения нормативных документов для сотрудников.Догнать и перегнать: Российские ВКС прирастают новыми функциями 8.4 т

Единая система, которая позволила бы вести управление жизненным циклом нормативной документации, в РЖД пока отсутствует. Поэтому компания хочет создать систему, которая обеспечила бы единое информационное пространство для управления нормативной документацией, содержала бы инструмент интеллектуального поиска по единому информационному пространству нормативных документов. Также она должна обеспечить управление полным жизненным циклом нормативных документов.

Нейросети в системе должны использоваться для проведения предобработки текста, семантического поиска данных в документах, семантического поиска по созданным векторным пространствам, указано требование в техзадании.

Система должна быть реализована с использованием софта из реестра отечественного ПО либо свободно распространяемого софта. При этом система не будет предназначена для работы с документами, содержащими сведения, составляющие коммерческую тайну, а также имеющих гриф «Для служебного пользования» или составляющих гостайну.

Общее число пользователей системы составит до 15 тыс. сотрудников.

Подвести итоги выбора поставщика РЖД планирует 7 октября 2021 года, а сроки выполнения работ обозначены 31 октября 2022 года.

Примечания