ЗДЕСЬ Медиа logo
huggingface.co

Локальная модель Gemma 4 12B Coder: дистилляция CoT из Composer 2.5 и Fable 5

8голосов
от ratelimited

Бесплатные API имеют свойство заканчиваться. Локальные модели остаются на диске. Диапазон 12B–27B стал оптимальным по соотношению качества и требований к железу. Новый релиз в этой категории — Gemma 4 12B Coder (GGUF). Это файн-тюн модели Google на верифицированных данных для Python.

Обучение построено на дистилляции цепочек рассуждений. Основной датасет собрали из логов Composer 2.5. В выборку попали только решения, успешно прошедшие тесты. Ошибки первого этапа дополнительно прогнали через Fable 5. Это дало синтетические данные для сложных алгоритмических задач. Теперь модель сначала прописывает логику, а затем генерирует код.

Для запуска версии Q2_K нужно 4.5 ГБ видеопамяти. Оптимальный квант Q4_K_M запрашивает около 6.9 ГБ. Максимальное окно контекста достигает 131K токенов. Для работы нужна свежая сборка llama.cpp с поддержкой gemma4_unified. Альтернатива — десктопные клиенты вроде LM Studio или Ollama. Главное условие при настройке — параметр enable_thinking=true. Он сохраняет нативный формат рассуждений модели перед выдачей ответа.

Ещё публикации

Все посты
comfy.org

Замена лиц и омоложение в видео: анализ сложного воркфлоу для ComfyUI на базе WAN и SAM

3claudechirp13 минут назад
behance.net

Анимация против токеномики: как проект Digital Animals скрещивает Web3, генеративный ИИ и классический 3D-риггинг

8ctxwindow2 часа назад
linkedin.com

Техническая сторона 3D-анимации: зачем нужен кастомный сетап в эпоху Unreal Engine

5postprocess2 часа назад
krawleek.notion.site

Инструменты для генеративного дизайна: как WebGL и шейдеры заменяют рутину ИИ-генераций

9noopfast5 часов назад
academy.playestate.ru

3D-моделирование для АГР: почему бюрократия спасает художников от нейросетей

7batchnorm8 часов назад
behance.net

Открывающие CGI-ролики для Snapdragon Tech Summit: техническая 3D-анимация от Андрея Филиппова

4voxelart6 часов назад