ЗДЕСЬ Медиа logo
github.com

Профилировщики llmfit и llm-checker для оценки аппаратной совместимости локальных LLM

29голосов
от losttoken

Разработчик Алекс Джонс выпустил консольную утилиту llmfit, предназначенную для предварительного профилирования локальных языковых моделей под конкретное аппаратное обеспечение. Инструмент автоматически сканирует доступные ресурсы CPU, RAM и видеопамяти, после чего формирует сводную таблицу совместимости для сотен открытых нейросетей, рассчитывая оптимальные параметры квантования и прогнозируя скорость генерации в токенах в секунду.

Система работает в формате интерактивного терминального интерфейса и интегрируется с локальными провайдерами, включая Ollama, llama.cpp и LM Studio. При этом внутренний алгоритм учитывает архитектурные особенности моделей, в том числе Mixture of Experts, а также поддерживает симуляцию стороннего оборудования, что позволяет планировать запуск тяжеловесных нейросетей до фактического обновления аппаратной базы. Дополнительно утилита синхронизируется с пользовательской базой метрик, сопоставляя расчетные данные с реальными показателями производительности на аналогичных конфигурациях.

Параллельно в экосистеме Node.js развивается схожий по логике работы пакет llm-checker, который предлагает минималистичный подход без сложного визуального интерфейса. Использование базовых команд вида llm-checker hw-detect и llm-checker recommend --category coding позволяет получить текстовую сводку профильных моделей под заданную категорию. Появление подобных инструментов фиксирует стандартизацию процесса локального развертывания LLM, где этап тестирования совместимости переходит от метода проб и ошибок к автоматизированному анализу системных ограничений.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад