Что произошло
19 марта 2026 года в публикации OpenAI News компания сообщила, что использует отслеживание цепочек рассуждений и анализ реальных развертываний агентов, пишущих код, чтобы выявлять риски и усиливать меры безопасности ИИ.
Почему это важно
Мониторинг внутренних рассуждений помогает выявлять нежелательное или рискованное поведение агентов и даёт основу для улучшения превентивных и оперативных мер безопасности ИИ.
OpenAI описывает метод мониторинга «цепочек рассуждений» — внутренних шагов, которые агенты выполняют при написании кода — для изучения возможной смещённости в их поведении. Компания подчёркивает, что такой подход даёт контекст для оценки принятия решений агентами.
В публикации отмечено, что анализируется поведение агентов в реальных развертываниях с целью обнаружения потенциальных рисков и укрепления мер безопасности ИИ. Подробные метрики и конкретные результаты в статье не приводятся.