Любой релиз open-source модели от Apple вызывает автоматический интерес разработчиков. Но если посмотреть на их новый генератор LiTo, возникают сомнения в его практической ценности. В основе лежит токенизация поверхностного светового поля — алгоритм восстанавливает форму объекта через анализ освещения с разных ракурсов. Звучит как надежная база, но на практике подход пока не дает нужной плотности сетки.
Проблема в том, что исследователи выбрали довольно удобный бейзлайн для оценки качества. Они сравнивают результаты с первой версией TRELLIS, указывая на ошибки конкурента с ориентацией камеры. При этом пространственного разрешения самому LiTo явно не хватает, а геометрия получается слишком сглаженной. На фоне современных моделей вроде Hunyuan3D разработка Apple выглядит скорее как академический эксперимент.
Правда, проект может оказаться полезным с архитектурной точки зрения. Команда опубликовала код и веса, так что концепцию можно разобрать на запчасти. Сама идея работы со световыми полями для реконструкции объема имеет смысл для будущих пайплайнов. Вопрос лишь в том, станет ли кто-то развивать этот фреймворк при наличии более мощных альтернатив.
Поделиться:
taste-skill: можно ли запрограммировать хороший вкус для AI-агентов
Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust