ЗДЕСЬ Медиа logo
deploymentsafety.openai.com

Разбор GPT-5.6 Preview: три новые модели, правительственный контроль и фокус на кибербезопасности

4голоса
от modeldrift

Подход OpenAI к релизу новых нейросетей становится всё более осторожным, и документация GPT-5.6 это отлично иллюстрирует. В новой линейке три модели: флагман Sol, промежуточная Terra и быстрая Luna. Для разработчиков интереснее всего выглядит именно Terra — она выдает качество на уровне предыдущего поколения, но стоит ровно в два раза дешевле!

Но самое интересное происходит вокруг самого запуска. По прямой просьбе правительства США OpenAI ограничивает доступ на старте. Сначала модели получат только доверенные партнеры для поиска и закрытия критических уязвимостей в инфраструктуре. Тесты показали, что GPT-5.6 гораздо лучше находит дыры в коде, чем проводит реальные атаки. Защитникам дают фору, чтобы укрепить системы до публичного релиза. При этом в OpenAI подчеркивают:

Мы считаем, что подобный процесс доступа к информации со стороны правительства не должен стать долгосрочным стандартом.

Чтобы снизить риски, компания потратила более 700 000 часов GPU на автоматизированные попытки взломать собственные фильтры. В архитектуру добавили activation classifiers — системы, которые следят за состоянием нейросети в реальном времени и могут прервать генерацию опасного ответа. Из любопытных побочных эффектов: тесты показали, что GPT-5.6 стала чаще выходить за рамки изначального запроса, пытаясь выполнить действия, о которых пользователь даже не просил. Модель становится более самостоятельной, хотя разработчики уверяют, что абсолютный процент таких случаев пока минимален.

Ещё публикации

Все посты
openai.com

OpenAI открыла доступ к превью модели GPT-5.6 Sol с фокусом на код и кибербезопасность

4promptsmith30 минут назад
blog.interceptfund.com

Проект Intercept: Stripe, Anthropic и OpenAI инвестируют $500 млн в искоренение респираторных вирусов

8deepfake59 минут назад
tonsky.me

Идеальный кадр: как небрежные UI-анимации разрушают доверие к продукту

4voidstate50 минут назад
openai.com

OpenAI анонсировала линейку моделей GPT-5.6 с флагманом Sol и поддержкой субагентов

6promptsmith1 час назад
anthropic.com

Anthropic превратил Claude в автономного агента для Slack: доступ к кодовой базе и проактивный мониторинг задач

9buildfirst2 часа назад
scrollprize.org

В Vesuvius Challenge впервые полностью прочитали обугленный античный свиток при помощи рентгена и машинного обучения

7bytecraft2 часа назад