МФТИ и ИППИ РАН: hybrid Random Forest Traffic Classifier (hRFTC)

Продукт
Разработчики: Московский физико-технический институт (МФТИ), ИППИ РАН (Институт проблем передачи информации РАН им. А. А. Харкевича)
Дата премьеры системы: 2025/01/21
Технологии: Data Quality - Качество данных

Основная статья: Управление качеством данных

2025: Представление алгоритма hRFTC

Предложенный объединённой научной группой из МФТИ и ИППИ РАН алгоритм под названием hybrid Random Forest Traffic Classifier (hRFTC) позволяет эффективно определять тип передаваемых данных, даже если они зашифрованы с использованием последних технологий. Для анализа его эффективности была собрана база данных шифрованного трафика шести стран Северной Америки, Европы и Азии. Доказанное качество классификации  — 94,6%. Об этом МФТИ сообщил 21 января 2025 года.

С увеличением объёма шифрованного интернет-трафика задача определения типа передаваемых данных становится всё более сложной. Протокол Transport Layer Security (TLS) обеспечивает защиту данных, однако новая версия протокола — Encrypted ClientHello (ECH) — скрывает ключевые метаданные, такие как Server Name Indication (SNI), что затрудняет процесс ранней классификации трафика (eTC). Это может негативно сказаться на качестве обслуживания в сетях, так как правильная классификация трафика необходима для эффективного управления ресурсами.

Этот алгоритм использует не только открытые параметры TLS ECH, но и статистические признаки трафика, такие как размеры пакетов и интервалы между их приходами. Такой подход позволил существенно увеличить точность распознавания данных с 38,4% до 96,4% по метрике F-score.  Масштабирование и наведение порядка в сервисе обслуживания медоборудования — опыт компании Медсервиспро

Как отмечает один из авторов проекта, студент базовой кафедры МФТИ в ИППИ РАН Антон Курапов, разработанный алгоритм может быть использован на промежуточных сетевых узлах для повышения качества обслуживания.

«
Наш алгоритм hRFTC превзошёл лучшие существующие классификаторы и может быть использован на промежуточных сетевых узлах для повышения качества обслуживания. С другой стороны, мы выявили оставшиеся утечки приватности шифрованного трафика, которые необходимо устранить в будущих версиях протоколов защиты транспортного уровня, —  продолжил Антон Курапов.
»

На январь 2025 года командой лаборатории беспроводных сетей ведётся исследование по устранению этих утечек приватности с помощью рандомизации открытых параметров, а также изменения длин первых пакетов потока и отправки дополнительных фиктивных пакетов. 



Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Datareon (Датареон) (272)
  Axelot (Акселот) (150)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (48)
  АйТи Про (IT Pro) (18)
  Другие (555)

  Datareon (Датареон) (41)
  Axelot (Акселот) (32)
  Mains Lab (Мэйнс Лаборатория) (2)
  Софрос (Sofros) (2)
  Теком (2)
  Другие (41)

  Datareon (Датареон) (32)
  Axelot (Акселот) (19)
  Софрос (Sofros) (8)
  Яндекс.Облако (Yandex Cloud) (3)
  Департамент информационных технологий Москвы (ДИТ) (2)
  Другие (47)

  Datareon (Датареон) (19)
  Axelot (Акселот) (9)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (3)
  Софрос (Sofros) (3)
  Теком (3)
  Другие (66)

  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (2)
  СберМаркетинг (Sber Marketing) РА С-Маркетинг (1)
  Сбербанк (1)
  Северсталь Диджитал (Severstal Digital) (1)
  Северсталь-Инфоком (1)
  Другие (14)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Datareon (Датареон) (1, 421)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (3, 236)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (4, 49)
  АйТи Про (IT Pro) (1, 18)
  Дата-Центр Автоматика (1, 16)
  Другие (63, 61)

  Datareon (Датареон) (1, 71)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 2)
  Теком (1, 2)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (1, 2)
  Informatica (1, 1)
  Другие (4, 4)

  Datareon (Датареон) (1, 57)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 1)
  АйТи Про (IT Pro) (1, 1)
  Мобильные ТелеСистемы (МТС) (1, 1)
  Дата-Центр Автоматика (1, 1)
  Другие (1, 1)

  Datareon (Датареон) (1, 32)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 3)
  Теком (1, 3)
  TData (ТДата) (1, 2)
  Ростелеком (1, 2)
  Другие (1, 1)

  Datareon (Датареон) (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Datareon Platform - 421 (421, 0)
  Deductor - 226 (226, 0)
  HFLabs Фактор - 51 (28, 23)
  АйТи Про: BI.Qube - 18 (18, 0)
  HFLabs Подсказки - 17 (17, 0)
  Другие 43

  Datareon Platform - 71 (71, 0)
  HFLabs Фактор - 2 (0, 2)
  Loginom Аналитическая платформа - 2 (2, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 2 (0, 2)
  Ростелеком Платформа управления данными - 1 (0, 1)
  Другие -2

  Datareon Platform - 57 (57, 0)
  HFLabs Фактор - 2 (1, 1)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 1 (0, 1)
  АйТи Про: BI.Qube - 1 (1, 0)
  Дата-Центр Автоматика: Data-Track Индустриальная платформа - 1 (1, 0)
  Другие -1

  Datareon Platform - 32 (32, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 3 (0, 3)
  HFLabs Фактор - 3 (1, 2)
  Ростелеком Платформа управления данными - 2 (0, 2)
  Другие -7

  Datareon Platform - 1 (1, 0)
  Другие 0