Яндекс: YaFSDP Библиотека для ускорения обучения больших языковых моделей

Продукт
Разработчики: Яндекс (Yandex)
Дата премьеры системы: 2024/06/11
Технологии: ITSM - Системы управления IT-службой

2024: Представление библиотеки YaFSDP

Яндекс разработал библиотеку YaFSDP и выложил ее в опенсорс. Об этом разработчик сообщил 11 июня 2024 года. Она значительно ускоряет обучение больших языковых моделей — как собственной разработки, так и сторонних, с открытым исходным кодом. Библиотека даёт ускорение до 25% — результат зависит от архитектуры и параметров нейросети. С помощью YaFSDP также можно расходовать до 20% меньше ресурсов графических процессоров (GPU), которые требуются для обучения. Теперь YaFSDP могут использовать компании, разработчики и исследователи по всему миру.

Библиотека Яндекса рассчитана в первую очередь на большие языковые модели, хотя она подходит и для других нейросетей — например, таких, которые генерируют изображения. YaFSDP позволяет сократить расходы на оборудование для обучения моделей — это особенно важно для стартапов и, к примеру, научных проектов.

Одна из сложностей в обучении больших языковых моделей — это недостаточная загрузка каналов коммуникации между графическими процессорами. YaFSDP это решает. Библиотека оптимизирует использование ресурсов GPU на всех этапах обучения: pre-training (предварительное), supervised fine-tuning (с учителем), alignment (выравнивание модели). Благодаря этому YaFSDP задействует ровно столько графической памяти, сколько нужно для обучения, при этом коммуникацию между GPU ничто не замедляет.

Яндекс разработал YaFSDP в процессе обучения своей генеративной модели нового поколения YandexGPT 3. Компания уже протестировала библиотеку на сторонних нейросетях с открытым исходным кодом. Например, если бы YaFSDP использовалась применительно к модели LLaMA 2, этап предварительного обучения на 1024 графических процессорах сократился бы с 66 до 53 дней.

Исходный код YaFSDP уже есть на GitHub[1]. Посмотреть подробности замеров можно в репозитории GitHub, а почитать про разработку библиотеки — на Хабре.

Примечания



Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Naumen (Наумен консалтинг) (332)
  Softline (Софтлайн) (98)
  Okdesk (Облачные Решения) (42)
  Террасофт (Terrasoft, ТС-Консалтинг) (38)
  Деснол Софт (35)
  Другие (683)

  Naumen (Наумен консалтинг) (14)
  Okdesk (Облачные Решения) (9)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (7)
  БизнесАвтоматика НПЦ (3)
  Helpdesk Systems (2)
  Другие (16)

  Naumen (Наумен консалтинг) (18)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (12)
  SimpleOne (Симпл 1) (10)
  Softline (Софтлайн) (3)
  КСК Технологии (2)
  Другие (19)

  Naumen (Наумен консалтинг) (10)
  Астра Группа компаний (8)
  SimpleOne (Симпл 1) (5)
  Флант (Flant) (3)
  Компания Комплит (Complete) (2)
  Другие (34)

  Naumen (Наумен консалтинг) (3)
  Астра Группа компаний (3)
  Онланта Код ИТ (2)
  Деснол Софт (1)
  Флант (Flant) (1)
  Другие (1)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Naumen (Наумен консалтинг) (7, 357)
  Microsoft (13, 76)
  OmniNet (ОмниНет) (4, 55)
  Террасофт (Terrasoft, ТС-Консалтинг) (4, 47)
  Okdesk (Облачные Решения) (1, 43)
  Другие (605, 573)

  Naumen (Наумен консалтинг) (3, 14)
  Okdesk (Облачные Решения) (1, 10)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (2, 7)
  БизнесАвтоматика НПЦ (1, 3)
  Информатика и Сервис (1, 2)
  Другие (9, 9)

  Naumen (Наумен консалтинг) (4, 18)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (1, 12)
  SimpleOne (Симпл 1) (1, 10)
  РусБИТех-Астра (ГК Астра) (1, 3)
  Деснол Софт (2, 2)
  Другие (10, 12)

  Naumen (Наумен консалтинг) (3, 12)
  РусБИТех-Астра (ГК Астра) (1, 12)
  SimpleOne (Симпл 1) (1, 8)
  Флант (Flant) (1, 4)
  Деснол Софт (2, 3)
  Другие (15, 18)

  Naumen (Наумен консалтинг) (1, 4)
  РусБИТех-Астра (ГК Астра) (1, 3)
  Онланта Код ИТ (1, 2)
  Флант (Flant) (1, 1)
  1С Акционерное общество (1, 1)
  Другие (1, 1)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Naumen Service Management Platform (NSMP) - 298 (9, 289)
  Microsoft System Center 2012 - 58 (18, 40)
  OmniTracker - 55 (41, 14)
  Naumen Service Desk - 52 (0, 52)
  Okdesk Система учета и регистрации заявок для малых и средних сервисных компаний - 43 (43, 0)
  Другие 180

  Okdesk Система учета и регистрации заявок для малых и средних сервисных компаний - 10 (10, 0)
  Naumen Service Desk - 9 (0, 9)
  ELMA365 Service - 6 (6, 0)
  Naumen Service Management Platform (NSMP) - 6 (3, 3)
  Visary Help Desk - 3 (3, 0)
  Другие -1

  ELMA365 Service - 12 (12, 0)
  SimpleOne ITSM (IT Service Management) - 10 (10, 0)
  Naumen Service Desk - 9 (0, 9)
  Naumen Service Management Platform (NSMP) - 8 (1, 7)
  РусБИТех-Астра: ALD Pro - 3 (3, 0)
  Другие -3

  РусБИТех-Астра: ALD Pro - 12 (12, 0)
  SimpleOne ITSM (IT Service Management) - 8 (8, 0)
  Naumen Service Management Platform (NSMP) - 7 (0, 7)
  Naumen Service Desk - 4 (0, 4)
  Flant Deckhouse Kubernetes Platform (DKP) - 4 (4, 0)
  Другие 9

  Naumen Service Management Platform (NSMP) - 4 (0, 4)
  РусБИТех-Астра: ALD Pro - 3 (3, 0)
  Onplatform Инфраструктурная платформа - 2 (2, 0)
  Flant Deckhouse Kubernetes Platform (DKP) - 1 (1, 0)
  Другие -4