
TriAttention от MIT, NVIDIA и Zhejiang University: сжатие KV‑кеша с пропускной способностью в 2,5 раза выше
Метод TriAttention сжимает KV‑кеш, достигая точности, сопоставимой с полным вниманием, и повышая пропускную способность в 2,5×.
AI-новости по теме «Чипы» в коротком редакторском формате.

Метод TriAttention сжимает KV‑кеш, достигая точности, сопоставимой с полным вниманием, и повышая пропускную способность в 2,5×.
Последние материалы внутри вертикали, отсортированные от нового к старому.

Метод TriAttention сжимает KV‑кеш, достигая точности, сопоставимой с полным вниманием, и повышая пропускную способность в 2,5×.
Открыть
MarkTechPost 6 апреля 2026 года опубликовал практическое руководство по запуску NVIDIA Transformer Engine с FP8 и режимами резервного выполнения.
Открыть
4 апреля 2026 года NVIDIA выделила достижения в обучении роботов, симуляциях и фундаментальных моделях.
Открыть
Google Gemma 4 вместе с NVIDIA‑оборудованием и OpenClaw позволяют запускать универсальные открытые модели локально на устройствах от Jetson до DGX Spark.
Открыть
On the latest episode of the Equity podcast, we recapped CEO Jensen Huang’s GTC keynote and debated what it means for Nvidia’s future.
Открыть
22 марта 2026 года Маск анонсировал совместную программу по созданию собственных чипов для двух компаний.
Открыть
AWS провёл закрытый тур по лаборатории Trainium вскоре после объявления Amazon о вложении $50 млрд в OpenAI.
ОткрытьМероприятие Nvidia не убедило инвесторов в наличии кризиса вокруг ИИ.
ОткрытьХуанг сказал, что был бы «глубоко встревожен», если бы разработчик с $500K потратил на токены ИИ менее $250K.
ОткрытьОптимизирована для «плотности интеллекта» и показывает улучшенное рассуждение и агентные способности.
ОткрытьДженсен Хуанг спрогнозировал $1 трлн продаж чипов ИИ до 2027 и представил NemoClaw и робота Olaf.
ОткрытьВо время двух с половинойчасового выступления Хуанг озвучил прогноз и предложил «OpenClaw strategy».
ОткрытьОперативное освещение конференции от NVIDIA Blog до 19 марта.
ОткрытьAWS описывает технические характеристики модели и даёт инструкции по её запуску в Bedrock.
ОткрытьGeForce NOW начал стримить виртуальную реальность с частотой 90 кадров в секунду и добавил Crimson Desert в облачную библиотеку.
ОткрытьПодразделение быстро растёт, но получает меньше внимания, чем чипы и гейминг.
ОткрытьNVIDIA связала симуляцию, обучение роботов и встраиваемые вычисления в единый стек.
Открыть
CloudXR 6.0 встроен в visionOS для потоковой передачи RTX‑ускоренной графики на Vision Pro.
Открыть
На NVIDIA GTC 2026 операторы из США и Азии объявили о создании взаимосвязанных ИИ‑сетей для выполнения инференса ближе к пользователям.
ОткрытьГлава Nvidia публично поднял планку ожиданий по будущему спросу на AI-чипы следующего поколения.
ОткрытьСоседние вертикали, которые чаще всего пересекаются в архиве.