Браузерное расширение Caveman Web меняет подход к контролю выходных данных в ChatGPT, Claude, Gemini и DeepSeek. Вместо настройки кастомных инструкций внутри каждого сервиса, плагин перехватывает запрос в момент отправки и локально дописывает жесткий префикс для модели. Главная задача — заставить нейросеть генерировать только суть, отсекая вежливость и филлеры. По оценкам первых пользователей, это снижает расход выходных токенов до 75%.
Архитектура инструмента построена на строгой приватности: здесь нет бэкенда, телеметрии и перехвата сетевого трафика. Процесс происходит локально в браузере. Доступно четыре пресета агрессивности. Lite дает легкий намек на краткость, Full требует сухой технической выжимки, а Ultra форсирует выдачу исключительно в виде маркированных списков. Также добавлен экспериментальный Wenyan — режим экстремального семантического сжатия.
Плагин не гарантирует математически точного сокращения биллинга, так как итоговое решение остается за LLM, и не модифицирует уже сгенерированный текст. Однако в веб-интерфейсах с жесткими лимитами на количество сообщений такой автоматический препроцессинг становится эффективным способом не тратить квоты на чтение избыточных рассуждений модели.
Поделиться:
Гибридный пайплайн в 3D-продакшене: интеграция Unreal Engine и AI-инструментов
Empero выпустили Qwythos-9B: uncensored reasoning-модель с контекстом на миллион токенов и обучением на трейсах Claude