Добавить в избранное

Браузерное расширение Caveman Web меняет подход к контролю выходных данных в ChatGPT, Claude, Gemini и DeepSeek. Вместо настройки кастомных инструкций внутри каждого сервиса, плагин перехватывает запрос в момент отправки и локально дописывает жесткий префикс для модели. Главная задача — заставить нейросеть генерировать только суть, отсекая вежливость и филлеры. По оценкам первых пользователей, это снижает расход выходных токенов до 75%.

Архитектура инструмента построена на строгой приватности: здесь нет бэкенда, телеметрии и перехвата сетевого трафика. Процесс происходит локально в браузере. Доступно четыре пресета агрессивности. Lite дает легкий намек на краткость, Full требует сухой технической выжимки, а Ultra форсирует выдачу исключительно в виде маркированных списков. Также добавлен экспериментальный Wenyan — режим экстремального семантического сжатия.

Плагин не гарантирует математически точного сокращения биллинга, так как итоговое решение остается за LLM, и не модифицирует уже сгенерированный текст. Однако в веб-интерфейсах с жесткими лимитами на количество сообщений такой автоматический препроцессинг становится эффективным способом не тратить квоты на чтение избыточных рассуждений модели.

Расширение Caveman Web: аппаратная лаконичность LLM и снижение расхода токенов до 75%

Ещё публикации

Расширение Caveman Web: аппаратная лаконичность LLM и снижение расхода токенов до 75%

Ещё публикации