Article

Mamba-3 — новая модель пространств состояний с состояниями в 2x меньше и улучшенной аппаратной эффективностью MIMO‑декодинга

Исследователи из Carnegie Mellon и Princeton представили Mamba-3 как вариант SSM, оптимизированный для снижения затрат при инференсе.

19 марта 2026 г. в 06:01Обновлено: 22 марта 2026 г. в 03:12Global AI News DeskMarkTechPost3 мин

Суть

Коротко по делу

01
Mamba-3 уменьшает размер состояний в 2× и повышает аппаратную эффективность MIMO‑декодинга, чтобы сократить вычислительные требования при инференсе.
02
Проект Mamba-3 был представлен исследователями из Carnegie Mellon и Princeton и описан в материале MarkTechPost от 19 марта 2026 года.
03
Авторы отмечают, что по мере того как вычисления в момент инференса становятся ключевым фактором производительности больших языковых моделей, архитектуры начинают смещать акцент…

Что произошло

Mamba-3 уменьшает размер состояний в 2× и повышает аппаратную эффективность MIMO‑декодинга, чтобы сократить вычислительные требования при инференсе.

Почему это важно

Если Mamba-3 окажется практичной в реальных задачах, уменьшение размера состояний и повышение аппаратной эффективности MIMO‑декодинга могут снизить требования к вычислениям при инференсе и упростить развёртывание моделей в продуктивных системах.

Разбор

Контекст

Проект Mamba-3 был представлен исследователями из Carnegie Mellon и Princeton и описан в материале MarkTechPost от 19 марта 2026 года. Модель позиционируется как новая реализация модели пространств состояний (SSM) с состояниями в 2× меньшего размера и улучшенной аппаратной эффективностью MIMO‑декодинга.

Что это меняет

Авторы отмечают, что по мере того как вычисления в момент инференса становятся ключевым фактором производительности больших языковых моделей, архитектуры начинают смещать акцент в сторону эффективности инференса. Традиционные трансформеры остаются доминирующими, но их квадратичная сложность по вычислениям и линейные требования к памяти создают узкие места при развёртывании, что и мотивирует разработку решений вроде Mamba-3, нацеленных на снижение вычислительных затрат при инференсе.

Источник

MarkTechPost

Mamba-3 — новая модель пространств состояний с состояниями в 2x меньше и улучшенной аппаратной эффективностью MIMO‑декодинга

marktechpost.com

Публичный источник сигнала; для спорных деталей полезно сверять первоисточник.

Открыть первоисточник

Почему архиву можно доверять

Источник виден, переписывание объяснено, обновления отмечены

Каждый материал привязан к первичному источнику, а не к случайному пересказу.

Мы разделяем, что произошло, почему это важно и что именно стоит проверить дальше.

Как устроена методология

Связанные материалы

17 апр.The DecoderНовость3 мин

Крупный план профильного лица андроида слева, в центре голографическая двойная спираль ДНК с плавающими биоблоками (мышь, растение, клетки) над лабораторным устройством, справа учёный в халате работает у микроскопа в современной лаборатории, холодная синяя подсветка, детализированная редакционная сц

OpenAI выпустила GPT‑Rosalind — модель рассуждения для исследований в бионауках

Модель создана для ускорения перехода от гипотез к экспериментам; доступ к ней сейчас строго контролируется.

Модели OpenAI

Открыть

16 апр.MarkTechPostНовость3 мин

Двое исследователей в лабораторных халатах внимательно изучают металлическую петлю в форме знака бесконечности с подсвеченными электронными дорожками, установленную на плате с компонентами; за ними — серверный зал и атмосферный робот.

UCSD и Together AI Research представили Parcae — стабильную архитектуру для петлевых языковых моделей

Авторы утверждают, что Parcae по качеству соответствует трансформеру в два раза большего размера.

Модели

Открыть

14 апр.MIT Technology Review AIНовость3 мин

Женщина-учёный в белом халате в лаборатории смотрит на три выставленных экспоната на столе: голографический мозг (символ ИИ), растение в стеклянной колбе (биотехнологии) и светящийся энергетический модуль (энергетика). Тёпло-холодное кинематографическое освещение, чистая и сфокусированная композиция

MIT Technology Review анонсировал список «10 Breakthrough Technologies» на 2026 год

Редакция готовит ежегодный список «10 Breakthrough Technologies» и сообщает о сложностях отбора для 2026 года.

Модели

Открыть

Еще по этой теме

13 апр.The DecoderНовость3 мин

Утекший мемурандум: OpenAI разрабатывает модель «Spud», которая «значительно улучшит» продукты компании

В меморандуме перечислены пять стратегических приоритетов корпоративного направления, включая платформенное решение для агентов ИИ.

Модели OpenAI

Открыть

12 апр.TechCrunch AIНовость3 мин

Три силуэта чиновников в костюмах стоят в комнате с серверными стойками и банковским хранилищем, наблюдая за крупной голубой голографической моделью мозга/нейросети, парящей над технологической платформой.

Чиновники администрации Трампа могут побуждать банки тестировать Mythos от Anthropic

TechCrunch сообщил 12 апреля 2026 года, что представители администрации Трампа поощряют банки пробовать модель Mythos компании Anthropic.

Модели

Открыть

11 апр.MarkTechPostНовость3 мин

Три исследователя в белых халатах в серверной комнате смотрят на центральную голографическую воронку, которая сжимает высокую стопку синих кубов слева в компактную стопку зелёных кубов справа; кинематографичное освещение, чистый фокус, журнальная иллюстрация.

TriAttention от MIT, NVIDIA и Zhejiang University: сжатие KV‑кеша с пропускной способностью в 2,5 раза выше

Метод TriAttention сжимает KV‑кеш, достигая точности, сопоставимой с полным вниманием, и повышая пропускную способность в 2,5×.

Чипы Модели

Открыть

10 апр.TechCrunch AIНовость3 мин

Человек у запертого стеклянного отсека с крупным замком и цепями; по ту сторону стекла — спокойный андроид (символ модели Claude); металлическая рука на переднем плане усиливает напряжение; холодный синий фон слева и тёплый оранжевый свет справа.

Anthropic временно заблокировала доступ создателя OpenClaw к Claude

Блокировка произошла после изменения цен для пользователей OpenClaw на прошлой неделе.

Модели

Открыть