Dataset Search

Продукт
Разработчики: Google
Дата премьеры системы: январь 2020 г
Отрасли: Интернет-сервисы
Технологии: Средства разработки приложений

2020: Запуск

В январе 2020 года Google запустила сервис для удобного поиска наборов данных Dataset Search после его тестирования на протяжении более одного года.

Этот инструмент позволяет по ключевым словам находить нужную информацию среди примерно 25 млн репозиториев, свободно доступных в интернете. Доступна сортировка результатов поиска по дате обновления, правам использования, стоимости доступа и формату скачивания.

Google запустила сервис для удобного поиска наборов данных

Как пишет издание SiliconANGLE, открытые датасеты играют все более важную роль в технологическом секторе на фоне быстрого распространения искусственного интеллекта. Чем сложнее ИИ, тем больше тренировочных данных нужно обработать, чтобы алгоритм стал готовым для серийного использования. Подобные Dataset Search порталы, где разработчики ИИ-систем могут централизованно искать данным, может стать ценным инструментом для проектов машинного обучения.

Кроме того, свои датасеты обычно предоставляют научно-исследовательские лаборатории и крупные организации, такие как Facebook.Масштабирование и наведение порядка в сервисе обслуживания медоборудования — опыт компании Медсервиспро

Перед полномасштабным запуском Dataset Search компания Google существенно доработала сервис по сравнению с бета-версией. В частности, было «значительно улучшено» качество описаний для репозиториев и добавлены новые фильтры, позволяющие пользователям сузить результаты поиска в зависимости от того, какой набор данных им требуется.

«
Теперь вы можете фильтровать результаты на основе желаемых типов наборов данных, которые вы хотите (например, таблиц, изображений, текста), или на основе того, доступен ли набор данных у поставщика. Если набор данных связан с географической областью, вы можете увидеть карту, — написала в блоге исследователь Google Наташа Ной (Natasha Noy).
»

Отмечается, что разработчики сервиса стремились к стандартизированному описанию данных, предложенных командой schema.org[1]

Примечания



Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Солар (ранее Ростелеком-Солар) (47)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (15)
  Форсайт (13)
  Axiom JDK (БеллСофт) ранее Bellsoft (10)
  Unlimited Production (Анлимитед Продакшен, eXpress) (10)
  Другие (399)

  Солар (ранее Ростелеком-Солар) (10)
  Форсайт (3)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  КРИТ (KRIT) (2)
  Cloud.ru (Облачные технологии) ранее SberCloud (2)
  Другие (13)

  Солар (ранее Ростелеком-Солар) (6)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  РЖД-Технологии (3)
  Robin (Робин) (3)
  Другие (23)

  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  Солар (ранее Ростелеком-Солар) (4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  Наносемантика (Nanosemantics Lab) (1)
  Нота (Холдинг Т1) (1)
  Другие (12)

  Форсайт (2)
  Актив (Актив-софт) (1)
  Наносемантика (Nanosemantics Lab) (1)
  РТК ИТ Плюс (1)
  Сенсор-Тех Лаборатория (1)
  Другие (0)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Солар (ранее Ростелеком-Солар) (2, 49)
  Microsoft (41, 47)
  Oracle (49, 26)
  Hyperledger (Open Ledger Project) (1, 23)
  IBM (33, 18)
  Другие (624, 315)

  Солар (ранее Ростелеком-Солар) (1, 11)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 3)
  Форсайт (1, 3)
  Сбербанк (1, 2)
  Cloud.ru (Облачные технологии) ранее SberCloud (1, 2)
  Другие (9, 9)

  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 6)
  Солар (ранее Ростелеком-Солар) (1, 6)
  Мобильные ТелеСистемы (МТС) (1, 4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 4)
  Robin (Робин) (1, 3)
  Другие (14, 24)

  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  Солар (ранее Ростелеком-Солар) (1, 4)
  Мобильные ТелеСистемы (МТС) (2, 3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
  T1 Digital (Т1 Диджитал) (1, 1)
  Другие (15, 15)

  Форсайт (1, 2)
  Наносемантика (Nanosemantics Lab) (1, 1)
  Актив (Актив-софт) (1, 1)
  РТК ИТ Плюс (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Solar appScreener (ранее Solar inCode) - 49 (49, 0)
  Hyperledger Fabric - 23 (23, 0)
  Windows Azure - 20 (20, 0)
  FIS Platform - 15 (15, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 14 (14, 0)
  Другие 320

  Solar appScreener (ранее Solar inCode) - 11 (11, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 3 (3, 0)
  BSS Digital2Go - 3 (3, 0)
  Cloud ML Space - 2 (2, 0)
  Tarantool Data Grid - 1 (1, 0)
  Другие 7

  Solar appScreener (ранее Solar inCode) - 6 (6, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  МТС Exolve - 4 (4, 0)
  РЖД и Робин: Облачная фабрика программных роботов - 3 (3, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 3 (3, 0)
  Другие 12

  EXpress Защищенный корпоративный мессенджер - 5 (5, 0)
  Solar appScreener (ранее Solar inCode) - 4 (4, 0)
  МТС Exolve - 2 (2, 0)
  Eftech.Factory - 1 (1, 0)
  GitFlic Российский сервис для хранения кода и работы с ним - 1 (1, 0)
  Другие 11

  Форсайт. Мобильная платформа (ранее HyperHive) - 2 (2, 0)
  Guardant SLK - 1 (1, 0)
  РТК ИТ Плюс: Акола Конструктор для создания порталов и приложений - 1 (1, 0)
  Другие 0