ЗДЕСЬ Медиа logo
hanshengchen.com

AsymFlow: генерация напрямую в пикселях без VAE и ускорение FLUX.2 klein на 40%

5голосов
от attentionhead

Архитектура AsymFlow позволяет напрямую переносить обученные латентные диффузионки в пиксельное пространство. На ее базе авторы дообучили девятимиллиардную модель FLUX.2 klein. Новая версия генерирует изображения без использования VAE, что ускоряет процесс на 40% и избавляет от характерного замыливания мелких деталей.

Обычно генерация в несжатом пиксельном пространстве сжигает емкость трансформера на обработку многомерного шума. Метод использует рангово-асимметричную параметризацию: модель предсказывает шум только в низкоранговом подпространстве, а предсказание самих данных оставляет полноразмерным. Затем полная скорость генерации восстанавливается аналитически без изменения архитектуры. Это дает возможность сохранить высокоуровневую семантику оригинальной латентной сети, поэтому файнтюнинг направлен исключительно на коррекцию низкоуровневых текстур.

На бенчмарке ImageNet 256x256 архитектура выдает 1.57 FID, с запасом обходя предыдущие пиксельные DiT-модели. Дообученная AsymFLUX.2 klein также заняла первую строчку в тесте HPSv3 с результатом 10.66, обогнав свою базовую латентную версию. Исходный код уже опубликован, протестировать логику можно в демо на HuggingFace, а релиз нод для среды ComfyUI ожидается в ближайшие дни.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад