ЗДЕСЬ Медиа logo
apps.apple.com

Локальная генерация на iPhone: как работает тернарная модель Bonsai Studio и в чем подвох

5голосов
от inferenceonly

Принято считать, что полноценная генерация изображений — удел мощных облачных серверов с кластерами видеокарт. Однако стартап PrismML пытается доказать обратное, выпустив приложение Bonsai Studio, которое крутит диффузионную сеть локально на смартфоне. Никаких запросов к API, нулевой сбор данных и открытые веса под лицензией Apache 2.0.

Под капотом здесь работает Bonsai Image 4B — экстремально сжатая версия модели FLUX.2 Klein 4B. Разработчики применили тернарную квантизацию, урезав основной блок Diffusion Transformer всего до 1.2 гигабайт. Правда, текстовый энкодер так сильно сжать не вышло, поэтому общий вес комплекта составляет около 3.5 гигабайт. На актуальном мобильном железе система способна выдать картинку 512×512 примерно за 12 секунд.

Вопрос в том, какую цену разработчики заплатили за такую портативность? Для запуска потребуется минимум iPhone 15 Pro с 8 гигабайтами объединенной памяти, так что владельцы устройств предыдущих поколений остаются за бортом. Кроме того, жесткое урезание весов неизбежно бьет по качеству мелких деталей и точности понимания сложных промптов. Это любопытный технический прецедент в области экстремального сжатия нейросетей, но пока скорее локальная игрушка для гиков, чем рабочий инструмент дизайнера.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад
Локальная генерация на iPhone: как работает тернарная модель Bonsai Studio и в чем подвох - ЗДЕСЬ Медиа