GPT-4 (нейросеть)

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: OpenAI
Дата премьеры системы: март 2023 г.
Отрасли: Интернет-сервисы
Технологии: Средства разработки приложений

Содержание

История

2025

OpenAI представила GPT-4.5 (Orion) с рекордной стоимостью 1 млн выходных токенов в $150

Первое, что сразу стоит отметить – это цена. Стоимость 1 млн выходных токенов достигла рекордных в индустрии 150 долларов vs $10 у GPT-4o, $60 у думающей o1 и всего $4.4 у o3-mini, а у конкурентов:

  • Claude 3.7 Sonnet – $15,
  • Qwen2.5 Max – $6.4,
  • DeepSeek R1 – $2.19,
  • Gemini 1.5 Pro – $5,
  • Gemini 2.0 Flash всего $0.4.

Запредельная цена за входные токены – 75 долларов, тогда как у GPT-4o в 30 раз меньше – $2.5, o3-mini – $1.1, а o1 – $15, в сравнении с конкурентами GPT-4.5 сильно проигрывает:

  • Claude 3.7 Sonnet – $3,
  • Qwen2.5 Max – $1.6,
  • DeepSeek R1 – $0.55,
  • Gemini 1.5 Pro – $1.25,
  • Gemini 2.0 Flash практически бесплатна - $0.1.

Отраслевой стандарт для высококачественных моделей составляет широкий диапазон от 0.5 до 3 долларов, но не $75, что, как минимум, в 30-50 раз выше нормы.

Цена делает модель абсолютно бесполезной для любых видов коммерческого внедрения при любых типах задач, писал Spydell Finance.

Почему? Прирост производительности не растет пропорционально в соответствии с невероятным ростом цены.

Сразу отмечается критически низкая скорость работы (так медленно не работает даже o1, которая в ТОПе антирейтинга по скорости работы) и отсутствие решительного прогресса в качестве генерации.Профессиональные дисплеи для медучреждений: как цифровые технологии улучшают качество обслуживания пациентов и работу медперсонала 2.2 т

В целом, по беглому взгляду модель уверенно лучше, чем устаревшая на два года GPT-4o, но прогресс не такой очевидный в сравнении с Claude 3.7 Sonnet и весьма спорное и неоднозначное сравнение с Grok 3.

Проблема в том, что качественные естественные (сгенерированные человеком) данные для обучения уже заканчиваются, что приводит к необходимости использования синтетических данных (сгенерированных нейросетями), оказывая драматическое влияние на интегральное качество дата-сетов, т.к. не существует механизмов достоверной верификации и валидации сверхбольших массивов синтетических данных.

Сравнивать с DeepSeek R1, o3-mini и другими «думающими» моделями некорректно, т.к. они функционируют по разным принципам.

Сравнение GPT-4o с GPT-3.5 два года назад показывало решительное превосходство, а вот сравнение GPT-4.5 с GPT-4o уже не так ярко, особенно на фоне существующих моделей и прогресса у конкурентов.

По предварительным оценкам, среди «нерассуждающих» моделей, GPT-4.5 либо на первом месте, либо в группе лидеров около Claude 3.7 Sonnet, Grok 3 и Gemini 2.0 Pro в зависимости от конфигурации задачи.

Из первых впечатлений: GPT-4.5 более лаконичен (это не всегда плюс, скорее даже минус, если задача стоит докопаться до деталей) и более естественен (язык более похож на разговорный, что также спорное преимущество, т.к. цель LLM получить ответ или решить задачу, а не поговорить).

GPT-4.5 — пример масштабирования неконтролируемого обучения путем масштабирования вычислений и данных, а также инноваций в области архитектуры и оптимизации. Результатом является модель, которая обладает более широкими знаниями и более глубоким пониманием мира, что приводит к уменьшению галлюцинаций и большей надежности в широком спектре тем.

Другими словами, модель более «эрудированная», больше набита всякими данными и знаниями.

GPT-4.5 поддерживает генерацию текста, обработку изображений, загрузку файлов и инструмент холста для совместного редактирования, но не поддерживает мультимодальные функции, такие как голосовой режим, видео и совместное использование экрана в ChatGPT. Функционал пока урезан, доступа в сеть пока нет в среде разработчиков.

OpenAI заявляет, что GPT-4.5 значительно лучше понимает «человеческие эмоции» и намерения, интерпретирует тонкие сигналы или неявные ожидания с большей нюансировкой, т.е. лучше развит «эмоциональный интеллект», что приводит к более естественному общению.

Еще главное преимущество – повышение точности и снижение галлюцинаций. В тесте PersonQA (проверка на галлюцинации) точность ответов выросла с 28% (GPT-4o) и 55% (o1) до 78% у GPT-4.5, а частота галлюцинаций снизилась с 52% до 19%.

Сравнение с конкурентами показывает конкурентоспособность, но не абсолютное лидерство, а это означает, что опыт использования будут определять функционал, способность к тонкой настройке и стабильность результатов (снижение галлюцинаций).

Учитывая запредельную цену и низкую скорость работы, выбор неоднозначный.

GPT-4o и другие нейросети не справляются с большинством задач по программированию — исследование OpenAI

Большие языковые модели (LLM) значительно упрощают и ускоряют написание программного кода, однако они не способны самостоятельно справляться с большинством задач по программированию. Об этом говорится в исследовании OpenAI, результаты которого опубликованы в середине февраля 2025 года. Подробнее здесь.

2024: Представлена нейросеть Pixtral Large c поисковиком, которая мощнее GPT-4

В середине ноября 2024 года французский стартап Mistral представил нейросеть Pixtral Large, способную конкурировать с GPT-4. Нейросеть на основе бесплатного чат-бота Le Chat способна генерировать изображения, проводить веб-поиск и служить интерактивным «холстом». Подробнее здесь.

2023

Запуск GPT-4 Turbo

6 ноября 2023 года компания OpenAI анонсировала GPT-4 Turbo — более мощную, функциональную и дешевую версию своей большой языковой модели (LLM) GPT-4. Эта «супернейросеть» получила обновленную базу знаний, которая содержит информацию о самых разных событиях в мировом масштабе вплоть до апреля 2023-го.

GPT-4 Turbo доступна в двух версиях: одна предназначена исключительно для анализа текста, а вторая понимает контекст как текста, так и изображений. Стоимость использования новой LLM составляет $0,01 за 1000 входных токенов (приблизительно 750 слов). При этом токены представляют собой фрагменты необработанного текста: например, слово «fantastic» будет разделено на «fan», «tas» и «tic», то есть, на три токена. Цена на выходные токены — те, которые GPT-4 Turbo генерирует на основе входных данных, — установлена на уровне $0,03 за 1000. В случае обработки изображений стоимость зависит от их размера. Так, по данным OpenAI, передача изображения размером 1080×1080 пикселей в GPT-4 Turbo будет стоить $0,00765.

OpenAI анонсировала GPT-4 Turbo
«
Мы оптимизировали производительность, поэтому можем установить на GPT-4 Turbo цены в три раза ниже для входных токенов и в два раза ниже для выходных токенов по сравнению с GPT-4, — заявляет OpenAI.
»

GPT-4 Turbo имеет расширенное контекстное окно — 128 тыс. токенов, что в четыре раза больше, чем у GPT-4. Это самое большое контекстное окно среди всех коммерчески доступных LLM. Объем в 128 тыс. токенов соответствуют примерно 100 тыс. слов или 300 страницам, что эквивалентно приблизительно содержимому книги «Путешествия Гулливера» Джонатана Свифта. Новая языковая модель по сравнению с GPT-4 лучше справляется с задачами, требующими тщательного следования инструкциям, таким как генерация определенных форматов — например, «всегда отвечать в XML».[1]

Разработана ИИ-система на GPT-4, которая быстро обучает роботов выполнять задачи лучше людей

20 октября 2023 года исследовательское подразделение Nvidia Research сообщило о разработке системы Eureka на основе искусственного интеллекта, предназначенной для обучения роботов сложным навыкам. В результате, машины получают возможность выполнять некоторые действия даже лучше людей. Подробнее здесь.

GPT-4 обманул защиту на основе ИИ: модель заменяет оружие на яблоки

Учёный из Google продемонстрировал, как модель GPT-4 обходит защиту других моделей машинного обучения, что подчёркивает значимость чат-ботов в качестве ассистентов исследователей. Об этом стало известно 1 августа 2023 года.

Для этого исследователь попросил GPT-4 разработать метод атаки и объяснить, как она работает.

AI-Guardian был разработан Гонгом Чжу, Шэнгчжи Чжаном и Кай Чэном и представлен в 2023 году . AI-Guardian был разработан для обнаружения модифицированных изображений, которые обманывают классификатор, и GPT-4 был задействован в обходе этого обнаружения.

Например, добавление дополнительных графических элементов к знаку «СТОП» может сбить с толку беспилотные автомобили. Это один из примеров злонамеренной модификации изображения, которое сканируется искусственным интеллектом в автомобиле.

В работе Карлини приводится код Python, предложенный GPT-4 для обхода мер защиты AI-Guardian от атак. GPT-4 сгенерировал сценарии и объяснения по настройке изображений для обмана классификатора. Так, классификатор может подумать, что фотография человека с оружием – это фотография человека с яблоком. Атаки снижают устойчивость AI-Guardian с заявленных 98% до 8%. Авторы AI-Guardian признали, что разработанный метод обхода успешно обманывает защиту AI-Guardian.

Для обхода защиты AI-Guardian было необходимо идентифицировать маску, используемую AI-Guardian для обнаружения враждебных примеров, показывая модели множество изображений, отличающихся только одним пикселем. Эта методика «грубой силы», описанная Карлини и GPT-4, в конечном итоге позволяет идентифицировать функцию активации обхода, чтобы затем можно было создать изображения для её обхода.

Карлини ожидает дальнейшего развития больших языковых моделей (Large Language Model, LLM).

«
Как калькулятор изменил роль математиков, существенно упростив выполнение механических расчетов, так и сегодняшние LLM-модели упрощают решение задач программирования, позволяя ученым тратить больше времени на разработку интересных исследовательских вопросов, - заключил Карлини[2].
»

Российская онлайн-школа Skyeng внедрила технологию GPT-4 в обучение

Онлайн-школа английского языка Skyeng запустила виртуального собеседника «Кешу» на основе чат-бота GPT-4. Об этом в компании рассказали в середине марта 2023 года. Подробнее здесь.

Создание продукта

14 марта 2023 года компания OpenAI, разработчик чат-бота ChatGPT, представила новую версию своей языковой модели на основе искусственного интеллекта, получившую обозначение GPT-4.

Сообщается, что GPT-4 — это крупная мультимодальная модель, обученная на огромном количестве данных, которые были не только взяты из открытых источников в интернете, но и лицензированы разработчиком. Это правильные и неправильные решения математических задач, рассуждения различного характера, противоречивые и последовательные утверждения и многое другое. Для тренировки нейросети применялась облачная инфраструктура Microsoft Azure. По заявлениям OpenAI, во многих реальных сценариях GPT-4 демонстрирует «производительность на уровне человека».

GPT-4 — это крупная мультимодальная модель, обученная на огромном количестве данных

Новая модель может принимать в качестве входных данных не только текст, но и изображения. В ряде задач, например, при обработке документов с текстом и фотографиями, диаграммами или снимками экрана, GPT-4 демонстрирует те же возможности, что и при вводе только текста. Сейчас функции обработки изображений проходят тестирование, а поэтому недоступны широкой публике.

Как отмечает OpenAI, в непринуждённой беседе разница между GPT-3.5 и GPT-4 может быть едва заметной. Ключевые различия проявляются, когда сложность задачи достигает определённого порога — модель GPT-4 более надёжна, креативна и способна обрабатывать гораздо более тонкие инструкции, нежели GPT-3.5.

Вместе с тем, говорят разработчики, новой модели присущи те же недостатки, что и предыдущим версиям. В частности, GPT-4 может «галлюцинировать» (выдумывать факты) и допускать ошибки в рассуждениях. Иногда нейросеть может совершать простые логические ошибки и принимать очевидные ложные утверждения от пользователя. Поэтому, как отмечает OpenAI, следует проявлять большую осторожность при использовании выходных данных языковой модели, особенно в задачах «с высокими ставками».[3]

Примечания



ПРОЕКТЫ (1) ИНТЕГРАТОРЫ (1) РЕШЕНИЕ НА БАЗЕ (2)
СМ. ТАКЖЕ (35)


Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Солар (ранее Ростелеком-Солар) (47)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (15)
  Форсайт (13)
  Бипиум (Bpium) (10)
  Axiom JDK (БеллСофт) ранее Bellsoft (10)
  Другие (399)

  Солар (ранее Ростелеком-Солар) (10)
  Форсайт (3)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  Cloud.ru (Облачные технологии) ранее SberCloud (2)
  КРИТ (KRIT) (2)
  Другие (13)

  Солар (ранее Ростелеком-Солар) (6)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  РЖД-Технологии (3)
  Robin (Робин) (3)
  Другие (23)

  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  Солар (ранее Ростелеком-Солар) (4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  РеСолют (1)
  Сбербанк-Технологии (СберТех) (1)
  Другие (12)

  Форсайт (2)
  Актив (Актив-софт) (1)
  Наносемантика (Nanosemantics Lab) (1)
  РТК ИТ Плюс (1)
  Сенсор-Тех Лаборатория (1)
  Другие (0)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Солар (ранее Ростелеком-Солар) (2, 49)
  Microsoft (41, 47)
  Oracle (49, 26)
  Hyperledger (Open Ledger Project) (1, 23)
  IBM (33, 18)
  Другие (624, 315)

  Солар (ранее Ростелеком-Солар) (1, 11)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 3)
  Форсайт (1, 3)
  Сбербанк (1, 2)
  Cloud.ru (Облачные технологии) ранее SberCloud (1, 2)
  Другие (9, 9)

  Солар (ранее Ростелеком-Солар) (1, 6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 6)
  Мобильные ТелеСистемы (МТС) (1, 4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 4)
  РЖД-Технологии (1, 3)
  Другие (14, 24)

  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  Солар (ранее Ростелеком-Солар) (1, 4)
  Мобильные ТелеСистемы (МТС) (2, 3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
  Оператор Газпром ИД (ГИД) (1, 1)
  Другие (15, 15)

  Форсайт (1, 2)
  Актив (Актив-софт) (1, 1)
  РТК ИТ Плюс (1, 1)
  Наносемантика (Nanosemantics Lab) (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Solar appScreener (ранее Solar inCode) - 49 (49, 0)
  Hyperledger Fabric - 23 (23, 0)
  Windows Azure - 20 (20, 0)
  FIS Platform - 15 (15, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 14 (14, 0)
  Другие 320

  Solar appScreener (ранее Solar inCode) - 11 (11, 0)
  BSS Digital2Go - 3 (3, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 3 (3, 0)
  Cloud ML Space - 2 (2, 0)
  Tarantool Data Grid - 1 (1, 0)
  Другие 7

  Solar appScreener (ранее Solar inCode) - 6 (6, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  МТС Exolve - 4 (4, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 3 (3, 0)
  РЖД и Робин: Облачная фабрика программных роботов - 3 (3, 0)
  Другие 12

  EXpress Защищенный корпоративный мессенджер - 5 (5, 0)
  Solar appScreener (ранее Solar inCode) - 4 (4, 0)
  МТС Exolve - 2 (2, 0)
  GitFlic Российский сервис для хранения кода и работы с ним - 1 (1, 0)
  Naumen Platform - 1 (1, 0)
  Другие 11

  Форсайт. Мобильная платформа (ранее HyperHive) - 2 (2, 0)
  Guardant SLK - 1 (1, 0)
  РТК ИТ Плюс: Акола Конструктор для создания порталов и приложений - 1 (1, 0)
  Другие 0