ЗДЕСЬ Медиа logo
huggingface.co

Microsoft Lens: 3.8B-параметровая text-to-image модель, которая работает быстро, но не умеет рисовать людей

3голоса
от modeldrift

Все привыкли, что релизы от крупных корпораций — это тяжеловесные, медленные и максимально отцензурированные нейросети. Microsoft Lens ломает этот стереотип, предлагая опенсорсную text-to-image модель на 3.8B параметров с подозрительно быстрой генерацией. Заявлено эффективное обучение на датасете Lens-800M с плотными описаниями и разрешение до 1440×1440. Под капотом работает 48-блочный MMDiT с латентами от FLUX.2 и текстовым энкодером GPT-OSS на 20B.

Главный козырь проекта — скорость. Дистиллированная версия Lens-Turbo выдает готовый результат всего за 4 шага, пока базовая модель требует около 50. На абстрактных композициях, узорах и сложных концептах архитектура действительно показывает достойные результаты. Но на этом технические победы заканчиваются. Как только в промпте появляются люди, хваленый пайплайн начинает сыпаться, выдавая анатомические артефакты.

Правда, у модели обнаружилась крайне нетипичная для Microsoft черта — практически полное отсутствие цензуры. Компенсирует ли свобода промптинга неспособность нормально сгенерировать персонажей? Модель задумывалась как легкий фундамент для комьюнити, но пока выглядит скорее как сырой драфт, требующий серьезного дообучения.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад