ЗДЕСЬ Медиа logo
huggingface.co

Bonsai 1-bit: языковая модель на 290 МБ, работающая в браузере через WebGPU

12голосов
от alexnix

Локальные нейросети наконец-то дошли до стадии, когда их размер перестает быть преградой для интеграции. Проект Bonsai 1-bit — это рабочая языковая модель, которая весит всего 290 мегабайт и запускается прямо в браузере! Все вычисления происходят на вашем устройстве через WebGPU, без единого запроса к сторонним серверам.

Такого экстремального сжатия авторы достигли за счет 1-битного квантования. Вместо привычных 16 или 8 бит на каждый параметр модели здесь используется абсолютный минимум памяти, но нейросеть при этом сохраняет способность связно генерировать текст. Это открывает совершенно иной уровень оптимизации для разработчиков. Теперь базовый ИИ-функционал можно встраивать в обычные веб-страницы, не заставляя пользователя загружать тяжелые файлы или платить за API.

Модель просто кэшируется браузером и начинает использовать мощности локальной видеокарты. Скорость вывода токенов напрямую зависит от конкретного железа, но архитектура позволяет добиться плавной работы даже на ноутбуках со слабой графикой. Это отличная техническая демонстрация того, как грамотная математика и работа с весами побеждают потребность в огромных вычислительных кластерах.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад