BSS: ASR (Automatic Speech Recognition)

Продукт
Разработчики: Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС)
Дата премьеры системы: 2024/06/20
Технологии: ИБ - Биометрическая идентификация,  Речевые технологии

2024: Создание модели ASR

Почти 80% качества автоматического распознавания казахского языка добилась компания BSS, всего за 3 месяца собрав собственную модель ASR (Automatic Speech Recognition). Об этом разработчик сообщил 20 июня 2024 года.

Технология ASR необходима для распознавания устной речи клиентов, которые обращаются к виртуальному ассистенту с запросами. Чтобы оперативно обучить модель в условиях отсутствия исходных данных, разработчики использовали реальные диалоги на казахском языке, содержащие релевантную для заказчика лексику. Аналитики BSS тщательно транскрибировали 10 часов аудиоматериалов, перенеся корректно их в текстовый режим.

Параллельно из открытых источников были собраны готовые речевые корпуса длительностью 1500 часов. На основе этих данных была обучена первая базовая версия модели, качество распознавания устной речи которой составило 70%. Затем базовая модель ASR была дообучена транскрибированными аналитиками 10-часовыми аудиоматериалами. После второй итерации модель показала качество в 80% на целевых запросах клиентов. На июнь 2024 года разработчики BSS запускают новый цикл обучения ASR, чтобы улучшить показатель распознавание устной речи.

Команда BSS осуществила переход модели ASR с архитектуры Conformer на ZIP-Former.

«
«Это позволило ускорить ASR в 3 раза и повысить качество распознавания речи на 5%. Также благодаря переходу на более производительную архитектуру реакция бота сокращается на 200-500 мс, что повышает естественность диалога с клиентами, — сказал Александр Крушинский.
»



Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Биолинк Солюшенс (BioLink Solutions) (134)
  Прософт Биометрикс (ProSoft Biometrics) (74)
  Индид, Indeed (ранее Indeed ID) (45)
  VisionLabs (ВижнЛабс) (35)
  Группа компаний ЦРТ (Центр речевых технологий) (31)
  Другие (467)

  Индид, Indeed (ранее Indeed ID) (6)
  Goodt (Гудт) (2)
  NDBC - ЭнДиБиСи (ранее НТТ ДАТА Бизнес Солюшнс, itelligence Россия, Ителлидженс) (2)
  VisionLabs (ВижнЛабс) (2)
  ВидеоМатрикс (Videomatrix) (2)
  Другие (21)

  Индид, Indeed (ранее Indeed ID) (7)
  Сбербанк (7)
  Сканпорт АйДи (Scanport) (6)
  VisionLabs (ВижнЛабс) (4)
  АйТи Бастион (3)
  Другие (15)

  Сбербанк (8)
  Сканпорт АйДи (Scanport) (3)
  Северсталь-Инфоком (3)
  Индид, Indeed (ранее Indeed ID) (2)
  ABC Consulting (Эй Би Си Консалтинг) (1)
  Другие (13)

  АйТи Бастион (1)
  Другие (1)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Биолинк Солюшенс (BioLink Solutions) (9, 140)
  Прософт Биометрикс (ProSoft Biometrics) (18, 84)
  VisionLabs (ВижнЛабс) (26, 51)
  Индид, Indeed (ранее Indeed ID) (1, 45)
  Группа компаний ЦРТ (Центр речевых технологий) (14, 39)
  Другие (361, 315)

  Индид, Indeed (ранее Indeed ID) (1, 6)
  Goodt (Гудт) (1, 3)
  ABC Solutions (Эй Би Си Солюшенс) (1, 3)
  VisionLabs (ВижнЛабс) (2, 2)
  ВидеоМатрикс (Videomatrix) (1, 2)
  Другие (9, 9)

  Сбербанк (3, 8)
  Индид, Indeed (ранее Indeed ID) (1, 7)
  VisionLabs (ВижнЛабс) (3, 6)
  Shenzhen Chainway Information Technology (1, 6)
  АйТи Бастион (1, 3)
  Другие (6, 6)

  Сбербанк (1, 8)
  Shenzhen Chainway Information Technology (1, 3)
  Индид, Indeed (ранее Indeed ID) (1, 2)
  Goodt (Гудт) (1, 1)
  VisionLabs (ВижнЛабс) (1, 1)
  Другие (5, 5)

  АйТи Бастион (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2022 год
2023 год
2024 год
Текущий год

  BioLink BioTime - 177 (123, 54)
  Indeed Access Manager (Indeed AM) - 45 (45, 0)
  VisionLabs Luna - 41 (25, 16)
  Biosmart Studio - 36 (36, 0)
  СКУД BioSmart - 27 (27, 0)
  Другие 300

  Indeed Access Manager (Indeed AM) - 6 (6, 0)
  Goodt (Ранее ZoZo RCAM, Revenue&Costs Assurance Management) - 3 (3, 0)
  VisionLabs Luna - 2 (1, 1)
  Vmx SILA: HSE - 2 (2, 0)
  КриптоБиоКабина (КБК) - 1 (1, 0)
  Другие 6

  Indeed Access Manager (Indeed AM) - 7 (7, 0)
  Shenzhen Chainway C-серия RFID-считывателей - 6 (6, 0)
  Сбербанк: Система оплаты по улыбке - 5 (5, 0)
  VisionLabs Luna - 4 (2, 2)
  АйТи Бастион: СКДПУ НТ Система контроля действий поставщиков ИТ-услуг - 3 (3, 0)
  Другие 4

  Сбербанк: Система оплаты по улыбке - 8 (8, 0)
  Shenzhen Chainway C-серия RFID-считывателей - 3 (3, 0)
  Indeed Access Manager (Indeed AM) - 2 (2, 0)
  Vmx SILA: HSE - 1 (1, 0)
  АйТи Бастион: СКДПУ НТ Система контроля действий поставщиков ИТ-услуг - 1 (1, 0)
  Другие 3

  АйТи Бастион: СКДПУ НТ Система контроля действий поставщиков ИТ-услуг - 1 (1, 0)
  Другие 0

Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (46)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (29)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (27)
  SteadyControl (19)
  Naumen (Наумен консалтинг) (15)
  Другие (214)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Naumen (Наумен консалтинг) (3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Другие (14)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Другие (29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Другие (38)

  Voice Systems Robotics (VSR, VS Robotics) (2)
  Сенсор-Тех Лаборатория (1)
  Napoleon IT (Наполеон Айти) (1)
  SteadyControl (1)
  Группа компаний ЦРТ (Центр речевых технологий) (1)
  Другие (3)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (18, 48)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4, 30)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (12, 29)
  SteadyControl HoReCa (1, 24)
  SteadyControl (1, 24)
  Другие (407, 235)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl HoReCa (1, 3)
  Voice Systems Robotics (VSR, VS Robotics) (1, 3)
  Naumen (Наумен консалтинг) (1, 3)
  Другие (12, 16)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl HoReCa (1, 7)
  SteadyControl (1, 7)
  Другие (18, 30)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Сбербанк (3, 5)
  SteadyControl (1, 5)
  SteadyControl HoReCa (1, 5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  Другие (28, 45)

  Voice Systems Robotics (VSR, VS Robotics) (1, 2)
  Сбербанк (1, 1)
  SteadyControl (1, 1)
  Наносемантика (Nanosemantics Lab) (1, 1)
  СалютДевайсы (ранее SberDevices) (1, 1)
  Другие (5, 5)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2022 год
2023 год
2024 год
Текущий год

  МТС Exolve Голосовой робот - 29 (5, 24)
  SteadyControl Система контроля и управления персоналом - 24 (24, 0)
  BSS Digital2Speech - 21 (21, 0)
  Voice2Med Система распознавания речи в медицине - 14 (14, 0)
  EXpress Защищенный корпоративный мессенджер - 13 (13, 0)
  Другие 170

  МТС Exolve Голосовой робот - 12 (1, 11)
  BSS Digital2Speech - 6 (6, 0)
  Naumen Erudite - 3 (3, 0)
  VS Robotics: VS Робот-оператор - 3 (3, 0)
  SteadyControl Система контроля и управления персоналом - 3 (3, 0)
  Другие -1

  МТС Exolve Голосовой робот - 9 (0, 9)
  SteadyControl Система контроля и управления персоналом - 7 (7, 0)
  BSS Digital2Speech - 6 (6, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  SmartLogger II - 4 (4, 0)
  Другие 12

  SteadyControl Система контроля и управления персоналом - 5 (5, 0)
  EXpress Защищенный корпоративный мессенджер - 5 (5, 0)
  BSS Digital2Speech - 4 (4, 0)
  Napoleon IT отзывы - 3 (3, 0)
  Robovoice Пользовательская no-code платформа для разработки ИИ-ботов - 3 (3, 0)
  Другие 34

  VS Robotics: VS Робот-оператор - 2 (2, 0)
  ЦРТ: Voice2X Платформа голосового ввода для крупного бизнеса - 1 (1, 0)
  Сбер: GigaChat - 1 (1, 0)
  Napoleon IT отзывы - 1 (1, 0)
  SteadyControl Система контроля и управления персоналом - 1 (1, 0)
  Другие 2