ЗДЕСЬ Медиа logo
github.com

Снижение стоимости API Claude до 70% через рендеринг текстового контекста в изображения

9голосов
от weightshift

Команда teamchong выпустила утилиту pxpipe, которая снижает расходы на API Claude до 70% за счет конвертации текстового контекста в графический формат. Биллинг визуальных данных у Anthropic зависит только от их разрешения в пикселях, а не от количества символов на них. Локальный прокси-сервер перехватывает запросы и упаковывает объемные системные промпты, документацию инструментов и старую историю переписки в плотные PNG-файлы. В результате технический контент дает около 3.1 символа на один токен изображения против 1 символа при классической отправке текста.

Механика опирается на возможности моделей к распознаванию текста, что означает неизбежную потерю точности на специфичных данных. По умолчанию утилита использует Fable 5, которая успешно читает сгенерированные графические блоки и решает логические задачи по ним без потери качества. Однако при работе со строгими последовательностями байтов, такими как 12-символьные hex-строки или идентификаторы, возможны тихие галлюцинации — модель придумывает значения вместо выдачи ошибки. Старшая модель Opus справляется с чтением такого плотного контекста значительно хуже, поэтому для нее алгоритм отключен на уровне базовых настроек.

Утилита запускается локально через npx pxpipe-proxy, после чего среда разработки перенаправляется на прокси-порт. Инструмент содержит встроенный калькулятор рентабельности: скрипт оценивает плотность символов в каждом запросе и применяет конвертацию только там, где математика токенов гарантирует снижение цены. При этом генерация ответов от нейросети происходит в стандартном текстовом потоке без изменений.

Ещё публикации

Все посты
elliotjaystocks.com

Оптический размер букв: как физика металлического набора вернулась в веб через вариативные шрифты

8makestuff53 минуты назад
github.com

Фоновое создание агентов в Claude Code для передачи контекста

6nullpointer2 часа назад
walkinglabs.github.io

Курс Learn Harness Engineering: проектирование систем контроля и верификации для AI-агентов

3runtime1 час назад
github.com

Очистка веб-страниц для LLM: как работает конвертер MD This Page

23tokenlimit1 день назад
figma.com

Figma пытается заменить IDE и After Effects: разбор новых бета-версий

9lightprobe18 часов назад
behance.net

Характер в строгой сетке: как устроены новые иконки супераппа Yango

29colorblind1 день назад
Снижение стоимости API Claude до 70% через рендеринг текстового контекста в изображения - ЗДЕСЬ Медиа