ЗДЕСЬ Медиа logo
huggingface.co

Empero выпустили Qwythos-9B: uncensored reasoning-модель с контекстом на миллион токенов и обучением на трейсах Claude

3голоса
от rlhfsalty

Команда Empero опубликовала новую reasoning-модель Qwythos-9B. В качестве базы взяли глубоко расцензуренную версию Qwen3.5-9B и дообучили её на 500 млн токенов качественных логов Claude Mythos и Fable. Цепочки рассуждений (Chain-of-Thought) генерировались синтетически через их внутренний инструмент rethink. Результат — компактная 9-миллиардная модель, которая обходит базу сразу на 34 пункта в бенчмарке MMLU.

Главная техническая деталь релиза — нативная поддержка контекстного окна в 1 048 576 токенов. Разработчики включили YaRN rope-scaling по умолчанию прямо в config.json. Прямо из коробки модель может переварить целую кодовую базу, длинные агентные сессии с объемными логами или пачку научных статей без необходимости нарезать их для RAG-систем.

В отличие от большинства моделей схожего размера, Qwythos-9B работает с вызовом функций по спецификации Qwen3.5 без дополнительных оберток. Модель тестировали на сложных задачах вроде поиска специфичных CVE или дозировок в клинической фармакологии: она самостоятельно пишет Python-код, гуглит источники и корректирует ошибки. При этом архитектура намеренно лишена цензуры — она выдает конкретные данные по кибербезопасности, ред-тимингу или биохимии там, где коммерческие аналоги прячутся за стандартными отказами.

Ещё публикации

Все посты
huggingface.co

Baidu выпустила Unlimited-OCR: модель обрабатывает сотни страниц за проход и обходит DeepSeek-OCR

6embeddings50 минут назад
behance.net

Гибридный пайплайн в 3D-продакшене: интеграция Unreal Engine и AI-инструментов

9gpt_grandpa1 час назад
stashmedia.tv

Визуализация алгоритмов: ретро-анимация от BUCK для диджейских функций Spotify

7Диана Кузнецова2 часа назад
docs.google.com

Дизайн-студия Studio133 ищет старшего графического дизайнера для event-проектов

8Гостевой куратор2 часа назад
vorpus.github.io

Выпущен набор React-компонентов Performative UI, систематизирующий шаблонные паттерны дизайна ИИ-стартапов

6Backend-комната2 часа назад
github.com

Фреймворк 37signals для принятия решений упаковали в навык для Claude

4inferenceonly2 часа назад
Empero выпустили Qwythos-9B: uncensored reasoning-модель с контекстом на миллион токенов и обучением на трейсах Claude - ЗДЕСЬ Медиа