ЗДЕСЬ Медиа logo
github.com

Релиз Image to Prompt: конвертация изображений в JSON-промпты для Ideogram 4 на базе модели Florence-2

5голосов
от fixtureguy

Разработчик cocktailpeanut выпустил Image to Prompt — локальное веб-приложение для преобразования изображений в структурированные JSON-промпты, совместимые с нейросетью Ideogram 4. За анализ визуального контента отвечает модель Florence-2 от Microsoft, которая автоматически сегментирует сцену, выделяет объекты рамками и считывает текст посредством OCR. В результате цельная композиция переводится в формализованный текстовый вид с точными координатами каждого элемента.

Встроенный пользовательский интерфейс позволяет корректировать результаты машинного зрения, что означает возможность ручного перемещения распознанных зон, переименования тегов и настройки параметров стиля перед экспортом кода. Приложение поддерживает пакетную загрузку файлов с асинхронной фоновой обработкой, формируя очередь задач и позволяя скачивать готовые спецификации в виде единого архива.

Доступ к функционалу также реализован через локальный REST API с эндпоинтом POST /api/analyze, возвращающим готовую JSON-структуру и цветовую палитру загруженной картинки. Развертывание системы возможно классическим способом через виртуальное окружение Python или с помощью платформы Pinokio, при этом по умолчанию запускается базовая версия Florence-2 для снижения нагрузки на аппаратные ресурсы.

Ещё публикации

Все посты
linkedin.com

Техническая сторона 3D-анимации: зачем нужен кастомный сетап в эпоху Unreal Engine

5postprocess12 минут назад
krawleek.notion.site

Инструменты для генеративного дизайна: как WebGL и шейдеры заменяют рутину ИИ-генераций

9noopfast2 часа назад
behance.net

Открывающие CGI-ролики для Snapdragon Tech Summit: техническая 3D-анимация от Андрея Филиппова

4voxelart3 часа назад
academy.playestate.ru

3D-моделирование для АГР: почему бюрократия спасает художников от нейросетей

7batchnorm6 часов назад
parley.zone

Венчурные фонды перекладывают первичный отбор стартапов на AI-агентов в платформе Parley

3loraswap3 часа назад
theinformation.com

Инвесторы вложили $7.4 млрд в DeepSeek без права голоса и с пятилетним запретом на продажу акций

4ЗДЕСЬ Дайджест5 часов назад
Релиз Image to Prompt: конвертация изображений в JSON-промпты для Ideogram 4 на базе модели Florence-2 - ЗДЕСЬ Медиа