OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд


OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд

OpenAI официально признала, что поспешила с обновлением GPT-4o, которое сделало ChatGPT чрезмерно «услужливым» и склонным к лести. В блоге компания признала, что игнорировала сигналы от экспертов, указывавших на странности в поведении модели.

Обновление задумывалось как улучшение работы с памятью, пользовательской обратной связью и более актуальными данными. Но в результате ChatGPT стал чрезмерно соглашаться с пользователями — даже в сомнительных или опасных ситуациях.

OpenAI связывает это с тем, что начала использовать оценки «палец вверх/вниз» как дополнительный сигнал вознаграждения — и это ослабило основной механизм, сдерживавший льстивость. В компании признали, что память модели тоже может усиливать подобное поведение.

При этом внутренние офлайн-тесты и A/B-эксперименты показали позитивные результаты — но отдельные эксперты уже тогда указывали, что с моделью «что-то не так».

В OpenAI заявили, что выводы были сделаны: теперь поведенческие отклонения смогут блокировать релиз, а пользователи смогут раньше тестировать обновления в рамках альфа-доступа. Кроме того, компания пообещала заранее предупреждать даже о «незначительных» изменениях в ChatGPT.

Ранее в ChatGPT появилась функция поиска и подбора товаров по запросу пользователя.


Source: https://postium.ru/openai-prishlos-priznat-chatgpt-stal-lstit/

Межтекстовые Отзывы
Посмотреть все комментарии
guest

Manus AI: что это за ИИ-агент, что умеет, как получить приглашение

Manus AI: что это за ИИ-агент, что умеет, как получить приглашение Автономные ИИ-ассистенты уже не фантастика, а реальность....

OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд

OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд OpenAI официально признала, что поспешила с обновлением GPT-4o,...

Нейросети для генерации изображений с надписями – 5 лучших

Нейросети для генерации изображений с надписями – 5 лучших Некоторые нейросети умеют не только генерировать картинки, но и...

Яндекс научил Поиск объяснять сложные задачи по алгебре для старшеклассников

Яндекс научил Поиск объяснять сложные задачи по алгебре для старшеклассников Яндекс продолжает развивать интеллектуальные функции своего Поиска: теперь...

VK запускает сервис AI Persona — ИИ-помощник для маркетологов

VK запускает сервис AI Persona — ИИ-помощник для маркетологов VK Predict представил AI Persona — инструмент на базе...

Xiaomi представила свою «рассуждающую» нейросеть MiMo

Xiaomi представила свою «рассуждающую» нейросеть MiMo Компания Xiaomi впервые выпустила собственную открытую языковую модель — MiMo. В пресс-релизе...

Qwen представила «думающую» модель QwQ-Max-Preview и режим «Thinking QwQ»

Qwen представила «думающую» модель QwQ-Max-Preview и режим «Thinking QwQ» Команда нейросети Qwen AI анонсировала QwQ-Max-Preview — новую модель...

ИИ-агент Manus AI стал доступен всем — есть бесплатные возможности

ИИ-агент Manus AI стал доступен всем — есть бесплатные возможности Сегодня китайский универсальный ИИ-агент Manus AI официально вышел...

Character.AI представила AvatarFX — нейросеть для создания реалистичных аватаров

Character.AI представила AvatarFX — нейросеть для создания реалистичных аватаров Платформа Character.AI — известная своими чат-ботами, имитирующими речь и...

Как создать картинку в Шедевруме — гайд 2025

Как создать картинку в Шедевруме — гайд 2025 Шедеврум – нейросеть Яндекса, представленная в апреле 2023 года в...

Число еженедельных пользователей ChatGPT превысило 400 миллионов

Число еженедельных пользователей ChatGPT превысило 400 миллионов Компания OpenAI сообщила о стремительном росте аудитории ChatGPT: число еженедельных активных...

Яндекс Маркет запустил AI-ассистента для подбора и сравнения товаров

Яндекс Маркет запустил AI-ассистента для подбора и сравнения товаров В приложении Яндекс Маркета появился чат с искусственным интеллектом...

10 нейросетей для создания карточек на маркетплейсах — Wildberries и Ozon

10 нейросетей для создания карточек на маркетплейсах — Wildberries и Ozon Нейросети способны значительно ускорить и упростить заполнение...

Роли для нейросети (ChatGPT и пр.): почему важна, как задать и настроить

Роли для нейросети (ChatGPT и пр.): почему важна, как задать и настроить Вы просите нейросеть: «Напиши текст про...

Perplexity AI: что это за нейросеть, как пользоваться на русском языке

Perplexity AI: что это за нейросеть, как пользоваться на русском языке Нейросеть Perplexity AI совмещает в себе функционал...

Yandex B2B Tech представил нейросервис для операторов контакт-центров — Yandex Neurosupport

Yandex B2B Tech представил нейросервис для операторов контакт-центров — Yandex Neurosupport Yandex B2B Tech запустил новый AI-инструмент для...

Что такое промт-инжиниринг и кто такие промпт-инженеры — простыми словами

Что такое промт-инжиниринг и кто такие промпт-инженеры — простыми словами Ты даёшь нейросети задание — она пишет банальность....

Сбер выпустил GigaChat 2.0 — нейросеть стала умнее, быстрее и продуктивнее

Сбер выпустил GigaChat 2.0 — нейросеть стала умнее, быстрее и продуктивнее Сбер официально представил второе поколение своей флагманской...

Авито внедряет нейросети для создания объявлений — A-Vibe и A-Vision

Авито внедряет нейросети для создания объявлений — A-Vibe и A-Vision Авито представила две новые нейросети, которые помогут пользователям...

Freepik выпустила «этичную» модель генерации изображений F-Lite — её обучали только на лицензированном контенте

Freepik выпустила «этичную» модель генерации изображений F-Lite — её обучали только на лицензированном контенте Freepik — один из...