ЗДЕСЬ Медиа logo
schneier.com

Сравнение возможностей GPT-5.5 и Claude Mythos в задачах поиска уязвимостей

8голосов
от trainloop

Британский институт безопасности ИИ опубликовал результаты тестирования, согласно которым GPT-5.5 от OpenAI демонстрирует эффективность в поиске программных уязвимостей, сопоставимую с закрытой моделью Claude Mythos. При этом Anthropic ограничивает доступ к Mythos рамками программы Project Glasswing для узкого круга профильных организаций, ссылаясь на способность нейросети автономно находить и эксплуатировать zero-day уязвимости. OpenAI, напротив, предоставляет доступ к своей модели широкой аудитории, что существенно меняет распределение инструментов для проведения сложных киберопераций.

Снижение порога входа касается не только флагманских решений. Сторонний анализ показывает, что компактные языковые модели достигают аналогичных результатов при условии грамотного выстраивания структуры промптов оператором. В результате автоматизация процессов поиска уязвимостей перестает зависеть от эксклюзивного доступа к корпоративным разработкам, требуя от пользователя лишь понимания логики работы с контекстным окном.

Несмотря на высокие показатели в тестах, архитектура текущих языковых моделей ограничивает их возможности сложным паттерн-мэтчингом на основе массива обучающих данных. Системы успешно идентифицируют известные классы уязвимостей и их неочевидные вариации, но не обладают механизмами абстрактного рассуждения для выявления принципиально новых векторов атак. Это означает, что подобные инструменты функционируют как множители усилий, результативность которых напрямую зависит от регулярного обновления баз данных профильными исследователями, формирующими новые паттерны угроз.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад