Добавить в избранное

Команда Empero опубликовала новую reasoning-модель Qwythos-9B. В качестве базы взяли глубоко расцензуренную версию Qwen3.5-9B и дообучили её на 500 млн токенов качественных логов Claude Mythos и Fable. Цепочки рассуждений (Chain-of-Thought) генерировались синтетически через их внутренний инструмент rethink. Результат — компактная 9-миллиардная модель, которая обходит базу сразу на 34 пункта в бенчмарке MMLU.

Главная техническая деталь релиза — нативная поддержка контекстного окна в 1 048 576 токенов. Разработчики включили YaRN rope-scaling по умолчанию прямо в config.json. Прямо из коробки модель может переварить целую кодовую базу, длинные агентные сессии с объемными логами или пачку научных статей без необходимости нарезать их для RAG-систем.

В отличие от большинства моделей схожего размера, Qwythos-9B работает с вызовом функций по спецификации Qwen3.5 без дополнительных оберток. Модель тестировали на сложных задачах вроде поиска специфичных CVE или дозировок в клинической фармакологии: она самостоятельно пишет Python-код, гуглит источники и корректирует ошибки. При этом архитектура намеренно лишена цензуры — она выдает конкретные данные по кибербезопасности, ред-тимингу или биохимии там, где коммерческие аналоги прячутся за стандартными отказами.

Empero выпустили Qwythos-9B: uncensored reasoning-модель с контекстом на миллион токенов и обучением на трейсах Claude

Ещё публикации

Empero выпустили Qwythos-9B: uncensored reasoning-модель с контекстом на миллион токенов и обучением на трейсах Claude

Ещё публикации