Modus ETL
Управление корпоративным хранилищем данных

Продукт
Разработчики: Modus (БиАЙ Про)
Дата последнего релиза: 2025/03/10
Технологии: BI,  Data Quality - Качество данных

Содержание

Основные статьи:


Modus ETL - российское решение, предназначенное для управления процессами ETL и Data Quality Management. Позволяет собирать данные из множества источников, обеспечивает процессы верификации, стандартизации, категоризации и трансформации данных.Масштабирование и наведение порядка в сервисе обслуживания медоборудования — опыт компании Медсервиспро

Modus ETL позволяет сформировать и обеспечить управление корпоративным хранилищем данных на СУБД MSSQL, PostgreSQL или Vertica.

Обеспечивает быстрое подключение источников данных за счет готовых интеграций с 1C, SAP, Oracle, различными СУБД, файлами Excel и другими веб-сервисами.

Решение реализовано на платформе 1С:Предприятие 8.3. Открытый для изменения код с возможностью самостоятельной доработки продукта 1С-разработчиками.

Работает на серверах под управлением ОС Windows и Linux.

Modus ETL включен в единый реестр российского ПО и имеет сертификацию «1С:Совместимо!».

2025: Modus ETL 1.6.11

10 марта 2025 года компания Modus сообщила о выходе обновления Modus ETL 1.6.11.

Modus ETL 1.6.11

По информации компании, изменения коснулись следующего.

Получение данных из источников:

  • Добавлена быстрая загрузка больших файлов форматов XLSX и CSV. Теперь 1 000 000 записей XLSX грузится за 53 секунды, а 4 000 000 записей CSV грузятся за 32 секунды.
  • Доработан механизм получения структуры метаданных хранилища из баз : повторное получение списка доступных таблиц и состава их полей (обновление метаданных) из баз данных 1С теперь происходит в ~5 раз быстрее.
  • Улучшен механизм проверки корректности пользовательских настроек, отвечающих за взаимодействие между Агентом ETL и Modus ETL. Теперь при проверке корректности пользовательских настроек нажатии на кнопку "Проверить доступность" происходит не только проверка доступности Агента ETL, но и проверка настроек Modus ETL. Так пользователи могут выявить некорректные настройки сразу, не дожидаясь возникновения ошибок в процессе получения данных.
  • Оптимизировано получение данных из источников 1С. Теперь данные передаются пачками фиксированного размера и сразу помещаются в хранилище. Это помогает обойти ограничения 1С-источников по передаче больших файлов и снижает потребление ОЗУ в базе-источнике.
  • Доработан Агент ETL: теперь заполнение параметров 'Адрес', 'Логин', 'Пароль' контролируется автоматически. Также добавлен вывод ошибок, выявленных при проверке, в лог работы.
  • В тестовой Альфа-версии добавлена возможность использования Агентом ETL модулей получения данных, написанных на языке Python. Теперь для загрузки данных, имеющих сложную и нестандартную структуру, можно будет подготовить специальный код на Python, встроить этот код в модуль получения данных в Modus ETL и настроить автоматическое получение данных.

Трансформация данных:

  • Теперь при копировании и переносе сценариев обработки данных схема (вёрстка) отображения шагов будет воспроизводиться в модели WorkFlow
  • В шаблон шага «Разделение строки» добавлена возможность использования «пробела» в качестве разделителя строк
  • В шаблон шага «Произвольный код » добавлена возможность в коде 1С использовать «Параметры сценария»
  • В шаблоне шага «Перенос данных» механизм создания таблицы-приемника оптимизирован и адаптирован под современные версии ClickHouse
  • Добавлена возможность при помощи изменения SQL-запроса выполнять тонкую настройку параметров создания временных таблиц хранилища
  • Добавлена кнопка "Расширенные настройки" для управления выбранным объектом WorkFlow. Теперь пользователь может заходить в свойства шагов сценария и изменять типы связей между шагами, выбирая тип «Временная таблица» или «Вложенный запрос».
  • В сценариях обработки данных были добавлены новые шаблоны: «Очистка таблицы», «Обновление таблицы», «Обновление таблицы из таблицы-источника»
  • Доработан Агент ETL: теперь работа шаблонов шагов сценария в части Machine Learning не требует установки отдельного специального сервиса.

Управление хранилищем:

  • Доработана форма создания и редактирования таблицы хранилища: реализовано интерактивное управление параметрами полей (столбцов) без необходимости «проваливаться» в форму настройки каждого поля. Это повышает удобство пользователя при работе и экономит время настройки таблицы на ~30%.
  • Доработана форма редактирования таблицы хранилища: добавлена возможность на основании таблицы хранилища создать и обновить простой набор данных на аналитическом портале Modus BI без необходимости создавать таблицу хранилища заново.
  • Доработана форма создания и редактирования таблицы хранилища: добавлен столбец 'Алиас', с помощью которого можно для каждого поля таблицы указать псевдоним для описательной документации, а также использовать его при создании простых наборов данных для аналитического портала Modus BI.
  • Добавлена возможность экспорта описания и структуры таблиц хранилища в виде файлов с описательной документацией в форматы PDF, XLSX, DOCX, TXT и не только. Теперь пользователь может использовать их для подготовки отчётной документации по проектам, пояснительных записок, инструкций и так далее. Это оптимизирует трудозатраты на подготовку документации по используемым таблицам и наборам данных минимум в два раза.

Команда Modus также поработала над информационной безопасностью Modus ETL. Теперь пароль строки подключения к ETL при выводе информации в файл лога скрыт.

Прочие доработки:

  • В очередной раз получен сертификат «1С:Совместимо» для Modus ETL
  • Выполнено обновление «1С:Библиотеки стандартных подсистем» до версии 3.1.9.
  • Доработан раздел «Основные настройки»: на вкладке «Прочее» в группу «Очистка журналов событий сбора данных» добавлены дополнительные опции управления (очистка журналов событий сбора данных, настройка расписания и события очистки).
  • Актуализирована служебная форма для тестирования взаимодействия между Modus ETL и Агентом ETL
  • На главной странице Modus ETL добавлена возможность скачивать дистрибутивы Агента ETL и Адаптера ETL для 1С. Если раньше нужно было получать дистрибутивы на сайте 1С или искать их в каталоге с шаблонами конфигураций 1С, то теперь этого делать не нужно.

2021

Добавление интерфейса Workflow

В обновленном релизе Modus ETL 1.5 появился интерфейс Workflow, который является более функциональной и удобной альтернативой настройке шагов сценария в виде таблицы. Об этом 21 июля 2021 года сообщила компания Modus BI.

Modus ETL развивается в концепции low-code, что подразумевает возможность настраивать ETL-операции в визуальном интерфейсе без необходимости написания кода.

Интерфейс WorkFlow дает возможность проектировать сценарии обработки данных:

  • размещая шаги на холсте и связывая шаги друг с другом для передачи данных и/или управления между шагами,
  • настраивая для шага правила обработки данных с использованием готовых шаблонов (мастеров) и правила сбора статистики и проверки качества данных.
  • при запуске сценария на выполнение в интерфейсе отображается выполнение сценария, сохраняются для последующего анализа логи выполнения и статистика по данным.

Кроме того, шаги сценария обработки данных могут выполняться параллельно, что обеспечивает гибкость настройки и большую производительность.

Пример параллельного выполнения шагов сценария в Workflow:

Также в Modus ETL 1.5 реализован обновленный дизайн приложения: изменены стили цветового оформления и существенно переработан интерфейс для большего удобства работы.

Основные возможности по управлению качеством данных

  • управление нормативно-справочной информацией
  • формирование отчетности в эталонных терминах
  • трансформация первичных данных в целевую модель
  • расчет ключевых показателей эффективности

Управление хранилищем данных Modus ETL
Архитектура Modus ETL

2017

Сертификат «1С:Совместимо!»

В 2017 году продукт «Модус:Управления корпоративным хранилищем данных (ETL)» получил сертификат «Совместимо! Система программ 1С:Предприятие».

Особенности и возможности программы

Продукт "Модус:Управление корпоративным хранилищем данных (ETL)" предназначен для построения и управления корпоративным хранилищем данных (КХД), автоматизированного сбора данных из различных источников данных, включая инструменты управления качеством данных.


(Данные актуальны на апрель 2017 года)

Управление сбором данных:

  • Использование в качестве источника "1C:Предприятие" (в т. ч. 1С:Fresh), данных баз данных (MS SQL, Oracle), веб-сервисов, файлов MS Excel;
  • Возможные приемники данных: внешние источники "1C:Предприятие", базы данных MS SQL;
  • Возможность настройки и сохранения правил сбора данных, включая настройки для указанного источника данных;
  • Возможность загрузки данных в несколько потоков (многопоточность);
  • Возможность загрузки данных по расписанию, включая визуализацию расписания загрузки данных;
  • Возможность визуального конструирования запроса на языке SQL/1C;
  • Возможность визуализации структуры метаданных базы "1C:Предприятие";
  • Управление обработкой данных:
  • Возможность настройки правил трансформации данных – сценариев на языке SQL/;
  • Возможность хранения актуальных данных и истории изменения данных (версии данных) в одной таблице;
  • Настройка правил версионирования данных: определение ключевых полей и расчет хэш-сумм;
  • Настройка правил валидации и очистки данных (использование преднастроенных шаблонов);
  • Настройка правил консолидации данных;

Другие возможности:

  • Возможность объединения правил выгрузки данных и сценариев трансформации данных в пакеты и настройку расписания под запуска пакетов;
  • Подсистема логирования процессов загрузки и трансформации данных;
  • Возможность уведомления на электронную почту о событиях системы;
  • Возможность написания произвольного алгоритма (AddOn) при загрузке и обработке данных;
  • Возможность подключения плагинов для процессов обработки данных;
  • Реализацияв системе рабочего места аналитика по сбору данных (АРМ аналитика).

Конфигурация "Хэндисофт: Управление корпоративным хранилищем данных (ETL)" не является самостоятельной, для ее работы необходимо наличие установленной платформы "1С:Предприятие 8.3" (не ниже версии 8.3.8).

Конфигурация "Хэндисофт: Управление корпоративным хранилищем данных (ETL)" разработана с использованием функционала "1С:Библиотеки стандартных подсистем".



ПРОЕКТЫ (1) ИНТЕГРАТОРЫ (1) РЕШЕНИЕ НА БАЗЕ (1)
СМ. ТАКЖЕ (4)


Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Прогноз (250)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
  RBC Group Украина (124)
  БизнесАвтоматика НПЦ (119)
  Консультационная группа АТК (100)
  Другие (2601)

  БизнесАвтоматика НПЦ (12)
  Форсайт (8)
  Manzana Group (М Софт) (6)
  ФТО (5)
  Optimacros (Оптимакрос) (3)
  Другие (75)

  AW BI (ОСТ) ранее Analytic Workspace (8)
  Manzana Group (М Софт) (7)
  БизнесАвтоматика НПЦ (5)
  OptiTeam Consulting, Оптитим Консалтинг (ранее MCB Consulting, ЭмСиБи Консалтинг) (4)
  Форсайт (4)
  Другие (64)

  Simetra (ранее А+С Транспроект) (13)
  Форсайт (9)
  БизнесАвтоматика НПЦ (7)
  Инфомаксимум (Infomaximum) (6)
  Arenadata (Аренадата Софтвер) (6)
  Другие (74)

  Simetra (ранее А+С Транспроект) (3)
  Arenadata (Аренадата Софтвер) (3)
  Manzana Group (М Софт) (3)
  VK Tech (ВК Технологии) (1)
  АТОМС Консалтинг (ATOMS Consulting) (1)
  Другие (11)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Qlik (QlikTech) (59, 464)
  Форсайт (20, 340)
  SAP SE (70, 303)
  Oracle (65, 267)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (4, 236)
  Другие (1130, 1712)

  БизнесАвтоматика НПЦ (1, 12)
  Форсайт (3, 8)
  Manzana Group (М Софт) (3, 6)
  Optimacros (Оптимакрос) (1, 6)
  Microsoft (1, 5)
  Другие (41, 51)

  Optimacros (Оптимакрос) (1, 10)
  Форсайт (2, 8)
  Manzana Group (М Софт) (2, 7)
  AW BI (ОСТ) ранее Analytic Workspace (2, 5)
  БизнесАвтоматика НПЦ (1, 5)
  Другие (38, 57)

  Simetra (ранее А+С Транспроект) (1, 13)
  Optimacros (Оптимакрос) (1, 11)
  VMware (2, 9)
  Форсайт (2, 9)
  Arenadata (Аренадата Софтвер) (2, 8)
  Другие (42, 71)

  Arenadata (Аренадата Софтвер) (2, 5)
  Manzana Group (М Софт) (3, 3)
  Simetra (ранее А+С Транспроект) (1, 3)
  Optimacros (Оптимакрос) (1, 2)
  SAP SE (1, 1)
  Другие (8, 8)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2022 год
2023 год
2024 год
Текущий год

  QlikView - 411 (370, 41)
  Форсайт. Аналитическая платформа (ранее Prognoz Platform) - 341 (321, 20)
  Deductor - 226 (226, 0)
  IBM Cognos - 162 (58, 104)
  Visary BI Платформа бизнес-аналитики - 119 (119, 0)
  Другие 1333

  Visary BI Платформа бизнес-аналитики - 12 (12, 0)
  Форсайт. Аналитическая платформа (ранее Prognoz Platform) - 8 (5, 3)
  Optimacros Платформа для оптимизационного и консолидационного планирования - 6 (6, 0)
  Microsoft Power BI - 5 (5, 0)
  QlikView.Next - 4 (0, 4)
  Другие 39

  Optimacros Платформа для оптимизационного и консолидационного планирования - 10 (10, 0)
  Форсайт. Аналитическая платформа (ранее Prognoz Platform) - 8 (7, 1)
  Manzana Customer Data Platform (CDP) - 7 (7, 0)
  Analytic Workspace BI-платформа - 5 (3, 2)
  Visary BI Платформа бизнес-аналитики - 5 (5, 0)
  Другие 40

  TransInfo - 13 (0, 13)
  Optimacros Платформа для оптимизационного и консолидационного планирования - 11 (11, 0)
  VMware Tanzu Greenplum - 9 (1, 8)
  Форсайт. Аналитическая платформа (ранее Prognoz Platform) - 9 (4, 5)
  Инфомаксимум: Proceset (Система класса Process mining) - 8 (8, 0)
  Другие 22

  VMware Tanzu Greenplum - 5 (0, 5)
  TransInfo - 3 (0, 3)
  Manzana Predictive Analytics - 2 (2, 0)
  Optimacros Платформа для оптимизационного и консолидационного планирования - 2 (2, 0)
  Data Marketing: Платформа CVM (Customer Value Management) - 1 (1, 0)
  Другие 1

Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Datareon (Датареон) (272)
  Axelot (Акселот) (150)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (48)
  АйТи Про (IT Pro) (18)
  Другие (555)

  Datareon (Датареон) (41)
  Axelot (Акселот) (32)
  Mains Lab (Мэйнс Лаборатория) (2)
  Софрос (Sofros) (2)
  Теком (2)
  Другие (41)

  Datareon (Датареон) (32)
  Axelot (Акселот) (19)
  Софрос (Sofros) (8)
  Яндекс.Облако (Yandex Cloud) (3)
  Департамент информационных технологий Москвы (ДИТ) (2)
  Другие (47)

  Datareon (Датареон) (19)
  Axelot (Акселот) (9)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (3)
  Софрос (Sofros) (3)
  Теком (3)
  Другие (66)

  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (2)
  СберМаркетинг (Sber Marketing) РА С-Маркетинг (1)
  Сбербанк (1)
  Северсталь Диджитал (Severstal Digital) (1)
  Северсталь-Инфоком (1)
  Другие (14)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Datareon (Датареон) (1, 421)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (3, 236)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (4, 49)
  АйТи Про (IT Pro) (1, 18)
  Дата-Центр Автоматика (1, 16)
  Другие (63, 61)

  Datareon (Датареон) (1, 71)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 2)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (1, 2)
  Теком (1, 2)
  TData (ТДата) (1, 1)
  Другие (4, 4)

  Datareon (Датареон) (1, 57)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 1)
  Дата-Центр Автоматика (1, 1)
  Теком (1, 1)
  АйТи Про (IT Pro) (1, 1)
  Другие (1, 1)

  Datareon (Датареон) (1, 32)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 3)
  Теком (1, 3)
  TData (ТДата) (1, 2)
  Ростелеком (1, 2)
  Другие (1, 1)

  Datareon (Датареон) (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Datareon Platform - 421 (421, 0)
  Deductor - 226 (226, 0)
  HFLabs Фактор - 51 (28, 23)
  АйТи Про: BI.Qube - 18 (18, 0)
  HFLabs Подсказки - 17 (17, 0)
  Другие 43

  Datareon Platform - 71 (71, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 2 (0, 2)
  Loginom Аналитическая платформа - 2 (2, 0)
  HFLabs Фактор - 2 (0, 2)
  Ростелеком Платформа управления данными - 1 (0, 1)
  Другие -2

  Datareon Platform - 57 (57, 0)
  HFLabs Фактор - 2 (1, 1)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 1 (0, 1)
  АйТи Про: BI.Qube - 1 (1, 0)
  Дата-Центр Автоматика: Data-Track Индустриальная платформа - 1 (1, 0)
  Другие -1

  Datareon Platform - 32 (32, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 3 (0, 3)
  HFLabs Фактор - 3 (1, 2)
  Ростелеком Платформа управления данными - 2 (0, 2)
  Другие -7

  Datareon Platform - 1 (1, 0)
  Другие 0