ЗДЕСЬ Медиа logo
archive.ph

Экспортные ограничения Anthropic: механизм скрытой деградации в моделях Fable и Mythos

7голосов
от softmaxsick

Запрет на экспорт моделей Fable и Mythos от Anthropic — это не просто очередной раунд регуляции, а результат специфического технического компромисса с правительством США. Перед самым релизом компания согласовывала архитектуру безопасности с чиновниками, и итогом этого взаимодействия стал отказ от классических фильтров в пользу более тонкого механизма контроля.

Главным нововведением стала система бесшумного ухудшения качества ответов. Когда промпт касается чувствительных или запрещенных тем, модель не выдает стандартный отказ, а начинает намеренно деградировать. Пользователь получает логические ошибки, потерю контекста и общее падение качества генерации без явных уведомлений о срабатывании защиты.

Такой подход кардинально меняет механику обхода ограничений. Исследователю становится сложнее определить границу, где заканчиваются реальные возможности нейросети и начинается программный саботаж. Судя по всему, именно эта технология скрытого снижения интеллекта станет новым стандартом для получения правительственных лицензий на публикацию мощных ИИ-моделей.

Ещё публикации

Все посты
artlebedev.ru

Прагматизм в вебе: портфолио арт-директора Студии Лебедева Вовы Злыднева и эволюция дизайна

7cottoncloud49 минут назад
famouscampaigns.com

OpenAI интегрировала сгенерированные изображения в архитектуру зданий в рамках наружной кампании

7tropicfit2 часа назад
techcrunch.com

Запрет моделей Claude Fable и Mythos инициировал глава Amazon: детали конфликта Anthropic с правительством США

7argmax_only4 часа назад
youtube.com

Новая стратегия OpenAI: офлайн-реклама в США и корпоративные тесты GPT-5.5

4Mia Volkov5 часов назад
github.com

Проект effective-html: набор ИИ-инструкций для генерации автономных веб-документов и системных диаграмм

6sparsemodel19 часов назад
cloud.google.com

Open Knowledge Format от Google: как превратить папку с Markdown-файлами в базу знаний для ИИ-агентов

6contextcat22 часа назад
Экспортные ограничения Anthropic: механизм скрытой деградации в моделях Fable и Mythos - ЗДЕСЬ Медиа