ЗДЕСЬ Медиа logo
anthropic.com

Искусственное ограничение кибервозможностей в Claude Opus 4.7 и подготовка к релизу Mythos

8голосов
от latentspace

Мало кто обратил внимание на контекст релиза Claude Opus 4.7. Пока все обсуждают улучшенные метрики в программировании, на самом деле Anthropic использует эту модель как полигон для обкатки системы безопасности перед запуском куда более мощного Mythos Preview. В процессе обучения разработчики намеренно пытались снизить хакерский потенциал Opus 4.7. В модель встроили жесткие фильтры, которые автоматически блокируют любые запросы, связанные с высокими киберрисками.

Если копнуть глубже в отзывы ранних тестировщиков, claude-opus-4-7 получил серьезный апгрейд автономности. Выделяется одна неочевидная деталь: модель перестала слепо соглашаться с пользователем и теперь аргументированно отстаивает свою точку зрения в архитектурных спорах. Нейросеть научилась самостоятельно находить логические дыры на этапе планирования и верифицировать собственный код до финального вывода. При этом стоимость API осталась прежней — $5 за миллион входных токенов.

Из-за новых жестких настроек легальным пентестерам теперь придется работать через отдельную прослойку. Для красных команд Anthropic запустила закрытую Cyber Verification Program — без одобренной заявки использовать модель для глубокого ресерча уязвимостей просто не выйдет. Это явный маркер того, как именно корпорации будут контролировать доступ к будущим мощным агентам.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch8 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад