Google DeepMind предложила AlphaEvolve: LLM переписала алгоритмы теории игр и превзошла экспертов
Метод AlphaEvolve использует большую языковую модель для автоматического переписывания алгоритмов MARL в играх с неполной информацией.

Коротко по делу
- 01
Google DeepMind представила AlphaEvolve — подход, в котором большая языковая модель переписывает алгоритмы для многопользовательского обучения с подкреплением (MARL) в играх с…
- 02
AlphaEvolve — метод Google DeepMind, в котором большая языковая модель генерирует и модифицирует компоненты алгоритмов для MARL в сценариях с неполной информацией.
- 03
Подобные задачи относятся к последовательным играм с приватной информацией игроков (например, покер), где традиционно разработка алгоритмов требовала интуиции и многократной…
Что произошло
Google DeepMind представила AlphaEvolve — подход, в котором большая языковая модель переписывает алгоритмы для многопользовательского обучения с подкреплением (MARL) в играх с неполной информацией; AlphaEvolve автоматизирует подбор схем взвешивания, правил дисконтирования и…
Почему это важно
Для исследователей и инженеров, работающих с MARL в последовательных играх с приватной информацией, AlphaEvolve может уменьшить время на ручной подбор алгоритмических компонентов и дать более конкурентные решения без длительной итерации.
Контекст
AlphaEvolve — метод Google DeepMind, в котором большая языковая модель генерирует и модифицирует компоненты алгоритмов для MARL в сценариях с неполной информацией. Система автоматически подбирает схемы взвешивания, правила дисконтирования и солверы равновесия вместо ручной итерации и проб и ошибок.
Детали
Подобные задачи относятся к последовательным играм с приватной информацией игроков (например, покер), где традиционно разработка алгоритмов требовала интуиции и многократной настройки. По данным статьи на MarkTechPost от 3 апреля 2026 года, подход DeepMind показал результаты лучше, чем алгоритмы, разработанные экспертами в этой области.
Что это меняет
Это означает, что этапы выбора весов, правил дисконтирования и солверов равновесия для MARL могут быть автоматизированы и оптимизированы LLM, что сокращает ручную настройку и может ускорить разработку более сильных агентов для игр с неполной информацией, таких как покер.






