A Generalist AI Agent SIMA

Микола Миколайович  Глибовець; Назарій Петрович Бачинський

doi:10.18523/2617-3808.2024.7.70-76

Узагальнений агент штучного інтелекту SIMA

Автор(и)

Микола Миколайович Глибовець Національний університет «Києво-Могилянська академія», Україна https://orcid.org/0009-0005-6942-8026
Назарій Петрович Бачинський Національний університет «Києво-Могилянська академія», Україна

DOI:

https://doi.org/10.18523/2617-3808.2024.7.70-76

Ключові слова:

штучний інтелект, агент, SIMA, віртуальне середовище

Анотація

Стаття аналізує проєкт SIMA (Scalable, Instructable, Multiworld Agent) від Google DeepMind, спрямований на створення узагальненого ШІ-агента, здатного виконувати завдання у різноманітних тривимірних середовищах за мовними інструкціями. Розглянуто методи навчання, оцінювання та особливості роботи агента, а також проведено порівняння з іншими проєктами, такими як OpenAI Five і AlphaStar. Попри досягнуті результати, висвітлено ключові виклики, зокрема технічні та етичні аспекти, що залишаються на шляху до створення загального штучного інтелекту.

Біографії авторів

Микола Миколайович Глибовець, Національний університет «Києво-Могилянська академія»

доктор фізико-математичних наук, професор кафедри інформатики факультету інформатики Національного університету «Києво-Могилянська академія», glib@ukma.edu.ua

Назарій Петрович Бачинський, Національний університет «Києво-Могилянська академія»

студент магістерської програми «Комп’ютерні науки» факультету інформатики Національного університету «Києво-Могилянська академія», n.bachynskyi@ukma.edu.ua

Посилання

Berner, C., et al. (2019). Dota 2 with Large Scale Deep Reinforcement Learning. https://doi.org/10.48550/arXiv.1912.06680.
Mathieu, M., et al. (2023). AlphaStar Unplugged: Large-Scale Offline Reinforcement Learning. https://doi.org/10.48550/arXiv.2308.03526.
Team, S., et al. (2024). Scaling Instructable Agents Across Many Simulated Worlds. https://doi.org/10.48550/arXiv.2404.10179.

##submission.downloads##

Опубліковано

2025-05-12

Номер

Том 7 (2024): Наукові записки НаУКМА. Комп’ютерні науки

Розділ

Статті

Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.

Автори, які публікуються у цьому журналі, погоджуються з такими умовами:

а) Автори зберігають за собою авторські права на твір на умовах ліцензії CC BY 4.0 Creative Commons Attribution International License, котра дозволяє іншим особам вільно поширювати (копіювати і розповсюджувати матеріал у будь-якому вигляді чи форматі) та змінювати (міксувати, трансформувати, і брати матеріал за основу для будь-яких цілей, навіть комерційних) опублікований твір на умовах зазначення авторства.

б) Журнал дозволяє автору (авторам) зберігати авторські права без обмежень.

в) Автори мають право укладати самостійні додаткові угоди щодо поширення твору (наприклад, розміщувати роботу в електронному репозитарії), за умови збереження посилання на його першу публікацію. (Див. Політика Самоархівування)

г) Політика журналу дозволяє розміщення авторами в мережі Інтернет (наприклад, у репозитаріях) тексту статті, як до подання його до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).