Утилита Image to Prompt конвертирует любые изображения в редактируемые JSON-промпты для нейросети Ideogram 4. Инструмент автоматически размечает исходник, генерирует координаты bounding box и создает текстовые описания объектов. На выходе получается готовый JSON для точного воссоздания структуры оригинального кадра.
За распознавание элементов отвечает легковесная vision-модель Florence-2 от Microsoft. Полученный код можно редактировать локально, меняя параметры отдельных участков перед отправкой в генератор. Приложение поддерживает пакетную обработку и позволяет выстраивать очередь из нескольких файлов.
Развернуть проект проще всего в один клик через менеджер платформ Pinokio. Также доступна ручная установка из исходного кода на GitHub. Локальный запуск работает без привязки к внешним облачным API и поддерживает Windows, macOS и Linux.
Поделиться:
Замена лиц и омоложение в видео: анализ сложного воркфлоу для ComfyUI на базе WAN и SAM
Анимация против токеномики: как проект Digital Animals скрещивает Web3, генеративный ИИ и классический 3D-риггинг