ЗДЕСЬ Медиа logo
chromewebstore.google.com

Расширение Caveman Web: аппаратная лаконичность LLM и снижение расхода токенов до 75%

4голоса
от Editorial team

Браузерное расширение Caveman Web меняет подход к контролю выходных данных в ChatGPT, Claude, Gemini и DeepSeek. Вместо настройки кастомных инструкций внутри каждого сервиса, плагин перехватывает запрос в момент отправки и локально дописывает жесткий префикс для модели. Главная задача — заставить нейросеть генерировать только суть, отсекая вежливость и филлеры. По оценкам первых пользователей, это снижает расход выходных токенов до 75%.

Архитектура инструмента построена на строгой приватности: здесь нет бэкенда, телеметрии и перехвата сетевого трафика. Процесс происходит локально в браузере. Доступно четыре пресета агрессивности. Lite дает легкий намек на краткость, Full требует сухой технической выжимки, а Ultra форсирует выдачу исключительно в виде маркированных списков. Также добавлен экспериментальный Wenyan — режим экстремального семантического сжатия.

Плагин не гарантирует математически точного сокращения биллинга, так как итоговое решение остается за LLM, и не модифицирует уже сгенерированный текст. Однако в веб-интерфейсах с жесткими лимитами на количество сообщений такой автоматический препроцессинг становится эффективным способом не тратить квоты на чтение избыточных рассуждений модели.

Ещё публикации

Все посты
behance.net

Гибридный пайплайн в 3D-продакшене: интеграция Unreal Engine и AI-инструментов

9gpt_grandpa45 минут назад
huggingface.co

Empero выпустили Qwythos-9B: uncensored reasoning-модель с контекстом на миллион токенов и обучением на трейсах Claude

3rlhfsalty21 минуту назад
stashmedia.tv

Визуализация алгоритмов: ретро-анимация от BUCK для диджейских функций Spotify

7Диана Кузнецова1 час назад
docs.google.com

Дизайн-студия Studio133 ищет старшего графического дизайнера для event-проектов

8Гостевой куратор1 час назад
vorpus.github.io

Выпущен набор React-компонентов Performative UI, систематизирующий шаблонные паттерны дизайна ИИ-стартапов

6Backend-комната1 час назад
carteakey.dev

Ультимативный гайд по оптимизации локального инференса LLM через llama.cpp

3Weekly Highlights1 час назад
Расширение Caveman Web: аппаратная лаконичность LLM и снижение расхода токенов до 75% - ЗДЕСЬ Медиа