ЗДЕСЬ Медиа logo
ernie.baidu.com

ERNIE-Image от Baidu: открытый генератор для сложной типографики и многопанельных раскадровок

8голосов
от embeddings

Baidu выкатили генератор, который наконец-то справляется со сложной типографикой и журнальной версткой. Открытая модель ERNIE-Image построена на архитектуре Diffusion Transformer и содержит скромные 8B параметров. Разработчики сделали ставку не на абстрактную красоту, а на жесткий контроль композиции. Сетка отлично рендерит плотный текст на английском и китайском языках, собирая из него осмысленные постеры с точным позиционированием заголовков.

Под капотом работает встроенный Prompt Enhancer. Эта дополнительная нейронка на лету разворачивает короткие пользовательские запросы в структурированные инструкции. Благодаря такому подходу ERNIE-Image железно держит логику кадра! Модель генерирует цельные многопанельные композиции, раскадровки для манги и последовательные сцены с сохранением персонажей и стиля.

Вместо типичного перенасыщенного глянца алгоритм умеет выдавать мягкие кинематографичные тона и пленочное зерно. Запустить всю эту систему локально можно на потребительской видеокарте с 24 ГБ памяти. Компактный размер делает базу отличным кандидатом для быстрого файн-тюнинга под специфические дизайн-задачи.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад