PolyAnalyst
Платформа визуальной разработки сценариев анализа данных и текстов

Продукт
Разработчики: Мегапьютер Интелидженс (Megaputer)
Технологии: BI,  Big Data,  Data Mining

Содержание

Polyanalyst - платформа визуальной разработки сценариев анализа данных и текстов, не требующая для работы навыков программирования.

Система представляет собой сквозной инструмент обработки и анализа. Она способна выгружать информационные потоки из всех общеприменяемых разнородных источников (стандартные файлы, базы данных, социальные сети и т.д.) и, проведя их интеллектуальную обработку, представлять полученные результаты в виде настраиваемых пользовательских отчетов.


2020

Прогнозная модель развития пандемии вирусной инфекции COVID-19

Российская компания-разработчик аналитических продуктов Мегапьютер Интеллидженс опубликовала в мае 2020 года собственную прогнозную модель развития пандемии вирусной инфекции COVID-19 на территории России. Модель наглядно визуализирована и представляет собой интерактивную карту прогноза достижения пика новых случаев заболеваемости COVID-19, а также общее число активных, смертельных и случаев выздоровлений. Результаты прогноза представляются как в общем по стране, так и по каждому отдельно взятому субъекту РФ.



Для всех регионов имеется собственный ежедневный прогноз количества подтвержденных и активных случаев заболевания, числа выздоровлений и летальных исходов. В результате анализа данных о пандемии алгоритмами машинного обучения была получена статистическая картина течения и распространения заболевания. По каждому показателю алгоритм формирует два варианта развития событий: реалистичный и пессимистичный. Второй строится за счет увеличения параметра дисперсии распределения. Это делается на случай снижения уровня самоизоляции, вызванного наступлением майских праздников.

Реклама
Ультралегкие Fujitsu LIFEBOOK для вашего бизнеса

Производительные устройства с высокой степенью защиты данных для комфортной работы как в офисе, так и дома. Ваше рабочее место всегда с вами вместе с мобильными Fujitsu LIFEBOOK

Узнать больше

Для формирования прогноза система проводит анализ исторических данных, получаемых из открытых источников. Модель использует алгоритмы машинного обучения и предиктивного анализа, учитывающие диффузии зараженных граждан между регионами в условиях беспрепятственного перемещения, а также строгость карантинных мер в том или ином субъекте. В ситуации, когда ключевые эпидемиологические характеристики COVID-19 еще достоверно не известны, выбранный подход к прогнозированию посредством ИИ может привести к получению наиболее точных прикладных результатов.

В основе методологии прогноза лежит сочетание различных техник. Совмещение разнообразных подходов необходимо так как прогноз строится для отдельных регионов, которые сильно различаются по степени развития эпидемии, демографическим показателям, да и по степени достоверности данных. Используется широкий спектр техник – и оптимизация феноменологических моделей, и устойчивые, но достаточно грубые методы типа деревьев решений, и такие точные алгоритмы как сверточные сети. Процедура их комбинирования также является предметом оптимизации- гиперобучение или «обучение обучению».

Представленный прогноз дает ответы на множество прикладных вопросов о борьбе с пандемией. Например, с какой нагрузкой в ближайшие дни может столкнуться система здравоохранения, и где уже сейчас могут быть смягчены карантинные меры. Также, сопоставив течение картины заболеваемости в регионе с введенными ограничительными мерами, можно сделать выводы об эффективности определенных методов борьбы с заболеванием.

При выполнении анализа учитывались общедоступные данные, полученные из открытых источников, таких как Роспотребнадзор и портал http://coronavirus-monitor.ru. Результаты анализа представляют собой прогноз, полученный на основе исторических данных, который следует учитывать только после тщательного, глубокого исследования, принимающего во внимание данные о картине течения заболевания, полученные из прочих источников.

Базовое описание и функциональные задачи

Комплексный процесс анализа выстроен из этапов очистки и подготовки данных, исследования с применением алгоритмов искусственного интеллекта и текстового анализа на 16 языках, а также публикации результатов в интерактивном веб-интерфейсе.

PolyAnalyst применяется в качестве открытой среды разработки. Она включает в себя элементы Low-code платформы, что совместно с механизмом визуального проектирования аналитического скрипта, позволяет пользователям, не обладающим специальными математическими знаниями и навыками программирования, самостоятельно создавать законченные многошаговые решения для анализа данных и автоматизации рабочих процессов.

  • Анализ структурированных данных.
  • Анализ текстовых данных: классификация, кластеризация, извлечение сущностей и фактов, выявление тенденций.
  • Разработка решений по автоматизации процессов работы с данными:
  • Контроль качества обслуживания клиентов путем анализа сообщений, отправляемых сотрудниками колл центров;
  • Юридической экспертизы договоров;
  • Диспетчеризация потока входящих документов;
  • Процессы и процедуры промышленных предприятий по использованию и анализу текстовых документов (договора, счета, финансовые сверки, накладные, жалобы, диспетчерские журналы, справочники НСИ, отзывы, переписка сотрудников, расшифровки переговоров и т.д.), в больших объемах проходящих через различные функциональные блоки: юридический, финансовый, продажи, маркетинг, обслуживание клиентов, анализ информационного поля, логистика, сопровождение бизнес процессов и т.д.
  • Визуализация результатов анализа и конструирование отчетов.

Ожидаемый эффект от внедрения

  • Отказ от затратного ручного труда по анализу данных;
  • Автоматизация рабочих процессов, подразумевающих взаимодействие с информационными потоками и документацией;
  • Повышение эффективности управленческих решений за счет роста их информированности;
  • Агрегирование информации из всего множества используемых источников;
  • Повышенная надежность финансовых/коммерческих расчетов и прогнозирование.



Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2017 год
2018 год
2019 год
Текущий год

  Qlik (QlikTech) (65, 461)
  SAP SE (95, 317)
  Прогноз (35, 308)
  IBM (69, 291)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (4, 233)
  Другие (892, 1212)

  Объединенное кредитное бюро (ОКБ) (4, 13)
  Qlik (QlikTech) (4, 13)
  SAP SE (6, 12)
  IBM (7, 9)
  Novo BI (Ново Би Ай) (3, 8)
  Другие (33, 56)

Распределение базовых систем по количеству проектов, включая партнерские решения

За всю историю
2017 год
2018 год
2019 год
Текущий год

  QlikView - 403 (363, 40)
  Prognoz Platform - 299 (282, 17)
  Deductor - 225 (225, 0)
  IBM Cognos - 154 (58, 96)
  SAP BusinessObjects - 96 (47, 49)
  Другие 1272

  Visary (Визари АИС) - 8 (8, 0)
  ОКБ: Скоринг Бюро - 8 (6, 2)
  QlikView - 7 (3, 4)
  Qlik Sense - 6 (6, 0)
  SAP Business Intelligence (SAP BI) - 4 (2, 2)
  Другие 70

  Novo Forecast Enterprise - 4 (4, 0)
  Apache Hive - 3 (3, 0)
  SAS Text Analytics - 3 (3, 0)
  SAS Visual Analytics - 3 (3, 0)
  SAS Visual Statistics - 3 (3, 0)
  Другие 25

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2017 год
2018 год
2019 год
Текущий год

Распределение базовых систем по количеству проектов, включая партнерские решения

За всю историю
2017 год
2018 год
2019 год
Текущий год