ЗДЕСЬ Медиа logo
github.com

Agent Governance Toolkit: Microsoft переносит безопасность ИИ-агентов из промптов в код

7голосов
от losttoken

Принято считать, что для контроля ИИ-агента достаточно написать строгий системный промпт. Но тесты показывают почти стопроцентную вероятность обхода любых текстовых запретов в современных LLM. Microsoft попыталась решить эту проблему и открыла исходный код Agent Governance Toolkit — набора инструментов для управления автономными системами. Авторы утверждают, что это первое решение, закрывающее все уязвимости из списка OWASP Agentic Top 10.

Вместо того чтобы уговаривать модель не ломать инфраструктуру, AGT перехватывает каждую попытку вызова функции до ее выполнения. Разработчик задает жесткие правила в обычных YAML-файлах. Движок проверяет контекст операции и либо разрешает действие, либо блокирует его с ошибкой GovernanceDenied. Это классическая ролевая модель доступа и песочница, обернутая вокруг любого популярного ИИ-фреймворка.

Но перенос контроля на уровень детерминированного приложения неизбежно усложняет архитектуру. Декларативные политики надежно защищают данные от случайного удаления, однако они же связывают агентам руки. Вопрос в том, не превратится ли хваленая автономность в фикцию, если обложить ИИ-ассистента десятками YAML-конфигов с запретами на каждое нестандартное действие.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад