ЗДЕСЬ Медиа logo
fal.ai

Анонимная модель Peanut оказалась 8B-генератором HiDream-O1: отказ от VAE и встроенный reasoning

5голосов
от promptsmith

Анонимная модель Peanut, которая недавно обходила конкурентов на слепых тестах, оказалась открытой разработкой Vivago. Это HiDream-O1-Image — 8-миллиардная модель, которая объединяет генерацию, редактирование и персонализацию объектов в едином пайплайне. Ей не нужны внешние адаптеры для точечных изменений.

Архитектурно авторы отказались от классического VAE. Внутри работает встроенный Reasoning-Driven Prompt Agent — он анализирует логику запроса до начала генерации. Это решает типичную проблему image-to-image, когда сеть игнорирует часть текста при попытке сохранить структуру исходника. Агент сам выстраивает цепочку рассуждений, чтобы точно применить правки.

Генератор поддерживает нативное разрешение до 2048 пикселей. Опробовать модель уже можно через песочницу fal.ai. Разработчики выпустили две версии: быструю dev для инференса за 28 шагов и стандартную на 50 шагов, а сами веса, включая дистиллированный вариант, выложены для локального использования.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад