Microsoft DeepSpeed

Продукт
Разработчики: Microsoft
Дата премьеры системы: сентябрь 2020 г
Технологии: Средства разработки приложений

2020: Анонс Microsoft DeepSpeed - инструмента для глубокого обучения моделей ИИ

В середине сентября 2020 года Microsoft представила на GitHub обновленную открытую версию библиотеки DeepSpeed. Она предназначена для оптимизации глубокого обучения моделей искусственного интеллекта (ИИ).

Как сообщает издание SiliconANGLE, уникальность решения DeepSpeed заключается в том, что она способна обучать модели ИИ на основе триллиона различных параметров. В Microsoft отмечают, что используемый разработчиками DeepSpeed метод, который получил название 3D-параллелизм, адаптируется к различным требованиям пользовательских решений, включая взаимодействие с огромными моделями, сохраняя при этом баланс и эффективность в масштабировании.

Microsoft выпустила открытый инструмент для глубокого обучения на основе триллиона параметров

Проблема, для решения которой был создан продукт DeepSpeed, заключается в том, что разработчики могут оснастить свои нейронные сети только таким количеством параметров, которое может обрабатывать их инфраструктура обучения ИИ. Другими словами, аппаратные ограничения являются препятствием для создания более масштабных и лучших моделей. DeepSpeed делает процесс обучения ИИ более эффективным на аппаратном уровне. Разработчики могут повысить уровень сложности создаваемого ими программного обеспечения ИИ без необходимости покупать дополнительную инфраструктуру.

Microsoft заявляет, что этот инструмент может обучать языковую модель с триллионом параметров с использованием 100 видеокарт Nvidia предыдущего поколения V100. Обычно, по заявлению компании, на выполнение этой задачи у 4000 видеокарт Nvidia A100 текущего поколения требуется 100 дней. И это при том, что A100 в 20 раз быстрее, чем V100.Масштабирование и наведение порядка в сервисе обслуживания медоборудования — опыт компании Медсервиспро

Microsoft заявляет, что даже если используемое оборудование будет сокращено до одного чипа V100, DeepSpeed все равно сможет обучить языковую модель с 13 миллиардами параметров. Для сравнения: самая большая языковая модель в мире имеет около 17 миллиардов параметров, а самая большая нейронная сеть в целом насчитывает около 175 миллиардов.[1]

Примечания



Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Солар (ранее Ростелеком-Солар) (47)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (15)
  Форсайт (13)
  Axiom JDK (БеллСофт) ранее Bellsoft (10)
  Unlimited Production (Анлимитед Продакшен, eXpress) (10)
  Другие (399)

  Солар (ранее Ростелеком-Солар) (10)
  Форсайт (3)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  КРИТ (KRIT) (2)
  Cloud.ru (Облачные технологии) ранее SberCloud (2)
  Другие (13)

  Солар (ранее Ростелеком-Солар) (6)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  РЖД-Технологии (3)
  Robin (Робин) (3)
  Другие (23)

  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  Солар (ранее Ростелеком-Солар) (4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  Наносемантика (Nanosemantics Lab) (1)
  Нота (Холдинг Т1) (1)
  Другие (12)

  Форсайт (2)
  Актив (Актив-софт) (1)
  Наносемантика (Nanosemantics Lab) (1)
  РТК ИТ Плюс (1)
  Сенсор-Тех Лаборатория (1)
  Другие (0)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Солар (ранее Ростелеком-Солар) (2, 49)
  Microsoft (41, 47)
  Oracle (49, 26)
  Hyperledger (Open Ledger Project) (1, 23)
  IBM (33, 18)
  Другие (624, 315)

  Солар (ранее Ростелеком-Солар) (1, 11)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 3)
  Форсайт (1, 3)
  Сбербанк (1, 2)
  Cloud.ru (Облачные технологии) ранее SberCloud (1, 2)
  Другие (9, 9)

  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 6)
  Солар (ранее Ростелеком-Солар) (1, 6)
  Мобильные ТелеСистемы (МТС) (1, 4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 4)
  Robin (Робин) (1, 3)
  Другие (14, 24)

  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  Солар (ранее Ростелеком-Солар) (1, 4)
  Мобильные ТелеСистемы (МТС) (2, 3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
  T1 Digital (Т1 Диджитал) (1, 1)
  Другие (15, 15)

  Форсайт (1, 2)
  Наносемантика (Nanosemantics Lab) (1, 1)
  Актив (Актив-софт) (1, 1)
  РТК ИТ Плюс (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Solar appScreener (ранее Solar inCode) - 49 (49, 0)
  Hyperledger Fabric - 23 (23, 0)
  Windows Azure - 20 (20, 0)
  FIS Platform - 15 (15, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 14 (14, 0)
  Другие 320

  Solar appScreener (ранее Solar inCode) - 11 (11, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 3 (3, 0)
  BSS Digital2Go - 3 (3, 0)
  Cloud ML Space - 2 (2, 0)
  Tarantool Data Grid - 1 (1, 0)
  Другие 7

  Solar appScreener (ранее Solar inCode) - 6 (6, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  МТС Exolve - 4 (4, 0)
  РЖД и Робин: Облачная фабрика программных роботов - 3 (3, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 3 (3, 0)
  Другие 12

  EXpress Защищенный корпоративный мессенджер - 5 (5, 0)
  Solar appScreener (ранее Solar inCode) - 4 (4, 0)
  МТС Exolve - 2 (2, 0)
  Eftech.Factory - 1 (1, 0)
  GitFlic Российский сервис для хранения кода и работы с ним - 1 (1, 0)
  Другие 11

  Форсайт. Мобильная платформа (ранее HyperHive) - 2 (2, 0)
  Guardant SLK - 1 (1, 0)
  РТК ИТ Плюс: Акола Конструктор для создания порталов и приложений - 1 (1, 0)
  Другие 0