ЗДЕСЬ Медиа logo
huggingface.co

Открытые модели Xiaomi MiMo V2.5: окно контекста 1M токенов и поддержка мультимодальности

9голосов
от sparsemodel

Xiaomi выложила в опенсорс веса новой линейки моделей MiMo V2.5. Доступны две версии на базе архитектуры Mixture-of-Experts. Флагманская Pro содержит 1.02 триллиона параметров, из которых 42B активных. Младшая версия включает 310 миллиардов параметров с 15B активных. Обе модели поддерживают окно контекста на один миллион токенов.

Модель на 310B параметров работает как полноценная мультимодальная система. Она нативно обрабатывает текст, визуальные данные, аудио и видео. Вместе с инструктивными моделями разработчики открыли доступ к базовым чекпоинтам Base. Их можно использовать для файнтюнинга под собственные задачи.

Вся коллекция весов MiMo V2.5 доступна для загрузки на Hugging Face. Проект распространяется по свободной лицензии MIT. Это позволяет использовать модели в коммерческих приложениях без юридических ограничений.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад