Принято считать, что открытые инструменты для новых генеративных моделей немедленно приводят к всплеску сложных творческих решений. Посмотрим, что происходит с экосистемой вокруг Ideogram 4, для которого энтузиасты начали активно выпускать пользовательские надстройки.
Платформы вроде HuggingFace и Civitai действительно быстро наполняются новыми весами. Правда, если изучить первые релизы, картина получается весьма предсказуемой. Вместо сложных стилистических экспериментов сообщество сфокусировалось на утилитарных вещах вроде Realism Engine или предельно узких NSFW-моделях формата mi55ionary. Авторы последних прямо указывают на отсутствие гибкости в своих решениях. Нейросеть просто аппаратно заставляют хорошо выполнять одну конкретную механическую функцию.
Вопрос в том, насколько архитектура самой модели приспособлена для глубокого файн-тюнинга под более комплексные задачи. Пока исходные воркфлоу показывают, что технический процесс обучения налажен, но концептуально это топтание на месте. Опенсорс-сообщество снова идет по пути наименьшего сопротивления. Разработчики штампуют одноразовые костыли для генерации привычных образов, полностью игнорируя потенциал работы с типографикой и сложной композицией, которыми изначально выделялся этот проект.
Поделиться:
Как Epic Games внедряет нейросети в концепт-арт: пайплайн с плагином GenMedia Bridge
Манифест алгоритмической музыки: почему трек Torpedo Boyz иллюстрирует принципы работы AI-генераторов