ChatGPT научился лучше распознавать контекст в чувствительных разговорах — обновление безопасности

OpenAI объявила о новых улучшениях безопасности ChatGPT, направленных на распознавание контекста в чувствительных разговорах. Теперь модель лучше понимает, когда обычный на первый взгляд запрос может быть сигналом серьёзных проблем — например, связанных с суицидом, самоповреждением или угрозой другим людям.
По словам компании, обновление основано на двухлетнем сотрудничестве с психиатрами, психологами и экспертами по суицидологии из Глобальной сети врачей OpenAI. Эксперты помогли настроить правила создания так называемых «сводок безопасности» — коротких фактических заметок о предыдущем контексте, которые хранятся ограниченное время и используются только в случае высокого риска.
Внутренние тесты показали значительное улучшение. В длинных диалогах (одна сессия) безопасность ответов выросла на 50% в случаях суицида и самоповреждения и на 16% в случаях угрозы другим. На модели GPT?5.5 Instant, которая сейчас используется по умолчанию, улучшение составило 52% для угроз другим и 39% для суицида и самоповреждения.
Ключевая идея обновления — научить ChatGPT различать безобидные запросы и те, что становятся опасными в контексте предыдущих сообщений. Например, если пользователь ранее проявлял признаки дистресса, а потом задаёт неоднозначный вопрос, система может распознать нарастающий риск и отреагировать более осторожно.
OpenAI подчёркивает, что такие случаи редки, но критически важны. Обновление не затрагивает обычные повседневные диалоги — система не будет чрезмерно реагировать на безобидные просьбы. Сводки безопасности не предназначены для персонализации или долговременной памяти, их цель — только помочь в редких ситуациях повышенного риска.
Эксперты отмечают, что использование контекста между разными сессиями — ещё один шаг вперёд. Если в одном разговоре были слабые признаки опасности, а через некоторое время пользователь возвращается с похожим запросом, система сможет соединить эти сигналы и ответить безопасно.






