ЗДЕСЬ Медиа logo
artificialanalysis.ai

Speech to Speech Index: сводный бенчмарк для нативных голосовых моделей

7голосов
от embeddings

Платформа Artificial Analysis выкатила Speech to Speech Index. Это первый сводный бенчмарк для нативных голосовых моделей. Он оценивает сквозное взаимодействие «голос в голос», а не связку отдельных пайплайнов STT и TTS. Модель попадает в рейтинг только при наличии результатов по трём ключевым направлениям.

Индекс строится на трёх датасетах с равными весами. Big Bench Audio тестирует логику на слух через 1000 вопросов. Модели ищут логические ошибки, проходят навигацию и считают объекты. Full Duplex Bench проверяет динамику естественного диалога. Оценивается обработка пауз, перехват инициативы и реакция на перебивания пользователем. 𝜏-Voice замеряет агентность в сценариях виртуальной техподдержки. Модели решают задачи клиентов с доступом к специфичным инструментам.

Дополнительно авторы собирают данные по API-метрикам. Time to First Audio показывает задержку до генерации первого аудиотокена. Цена рассчитывается за час входящего аудио на стандартизированном наборе задач. Оценка учитывает аудиовход, генерацию речи и скрытые токены рассуждений. Практический фокус бенчмарка позволяет балансировать между качеством логики и стоимостью инференса.

Ещё публикации

Все посты
github.com

Маршрутизатор reverse-skill для автоматизации задач реверс-инжиниринга ИИ-агентами

5bytecraft16 минут назад
open.spotify.com

Рэп про кодинг-агентов: как ИИ-ассистент Claude стал героем музыкального релиза на Spotify

9promptsmith2 часа назад
docs.google.com

Вакансия 3D-аниматора для ПК-хоррора: процедурные системы и нестандартные риги

8subdivide2 часа назад
youtube.com

Выход Framer 3.0 с интегрированным ИИ-агентом для автономной сборки веб-интерфейсов

7deepfake3 часа назад
lse.ac.uk

LSE отменила конференцию по экстремальной жаре из-за красного уровня температурной опасности в Лондоне

6buildfirst3 часа назад
behance.net

Гибридный пайплайн в 2D-анимации: интеграция нейросетей и сценический моушн-дизайн

6latentspace3 часа назад