Метод Монте-Карло та штучний інтелект: використання методу Монте-Карло в навчанні з підкріпленням
dc.contributor.author | Некрасова, Марія Володимирівна | |
dc.date.accessioned | 2025-01-03T08:38:46Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Навчання з підкріпленням - технологія, що найбільш швидко розвивається, застосовується при створенні штучних інтелектуальних систем. На даний момент ця галузь досить швидко розвивається і є надзвичайно затребуваною.. Багато дослідників по всьому світу активно працюють з навчанням з підкріпленням у різноманітних сферах: нейробіології, теорії управління, психології та багатьох інших. Метою даної роботи є обґрунтування можливості застосування методу Монте-Карло в навчанні з підкріпленням. Відомо, що основним у такому навчанні є фіксація аспектів реальної проблеми при взаємодії того, хто навчається з навколишнім світом для досягнення своєї мети. Тобто агент навчання повинен мати мету, пов’язану зі станом навколишнього середовища. Також необхідно мати можливість відчувати середовище та вчиняти дії, що впливають на нього. Формулювання завдання навчання з підкріпленням має враховувати все три аспекти – відчуття, дію та мету – у їх найпростіших формах. В статті показано, що методи Монте-Карло здатні вирішити проблеми навчання із підкріпленням, ґрунтуючись на усередненні результатів вибірки. Не можна використовувати лише перевірені дії або лише шукати нові - в цьому і полягає проблема, бо у стохастичній задачі кожна дія має бути випробувана багато разів, щоб отримати надійну оцінку очікуваної винагороди. Щоб забезпечити доступність чітко визначених результатів, у статті розглядаються методи Монте-Карло лише епізодичних завдань. При цьому показане застосування нестандартного підходу до навчання із заздалегідь невідомими навчальними прикладами, які підбиралися автоматично, у процесі оптимізації. Таким чином, методи Монте-Карло можуть бути успішно інкрементними лише на рівні епізодів. | |
dc.description.abstract | Reinforcement learning is the fastest growing technology used in the creation of artificial intelligence systems. At the moment, this field is developing quite rapidly and is extremely in demand. Many researchers around the world are actively working with reinforcement learning in various fields: neurobiology, control theory, psychology and many others. The purpose of this work is to substantiate the possibility of using the Monte Carlo method in reinforcement learning. It is known that the main thing in such learning is to fix aspects of a real problem during the interaction of the learner with the surrounding world to achieve his goal. That is, the learning agent must have a goal related to the state of the environment. It is also necessary to be able to feel the environment and take actions that affect it. The formulation of the reinforcement learning task should take into account all three aspects - sensation, action and goal - in their simplest forms. The article shows that Monte Carlo methods are able to solve reinforcement learning problems based on averaging the results of the sample. It is not possible to use only proven actions or only search for new ones - this is the problem, because in a stochastic problem each action must be tried many times to get a reliable estimate of the expected reward. To ensure the availability of well-defined results, the article considers Monte Carlo methods only for episodic tasks. In doing so, it shows the use of a non-standard approach to training with previously unknown training examples. | |
dc.identifier.citation | Некрасова М. В. Метод Монте-Карло та штучний інтелект: використання методу Монте-Карло в навчанні з підкріпленням / М. В. Некрасова // Вісник Національного технічного університету "ХПІ". Сер. : Динаміка і міцність машин = Bulletin of the National Technical University "KhPI". Ser. : Dynamics and Strength of Machines : зб. наук. пр. – Харків : НТУ "ХПІ", 2024. – № 2. – С. 47-52. | |
dc.identifier.doi | https://doi.org/10.20998/2078-9130.2024.2.315342 | |
dc.identifier.orcid | https://orcid.org/0009-0006-9285-0740 | |
dc.identifier.uri | https://repository.kpi.kharkov.ua/handle/KhPI-Press/84868 | |
dc.language.iso | uk | |
dc.publisher | Національний технічний університет "Харківський політехнічний інститут" | |
dc.subject | метод Монте-Карло | |
dc.subject | навчання з підкріпленням | |
dc.subject | прийняття рішень | |
dc.subject | моделі | |
dc.subject | оптимальність | |
dc.subject | штучний інтелект | |
dc.subject | Monte Carlo method | |
dc.subject | reinforcement learning | |
dc.subject | models | |
dc.subject | optimality | |
dc.subject | decision making | |
dc.title | Метод Монте-Карло та штучний інтелект: використання методу Монте-Карло в навчанні з підкріпленням | |
dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
- Назва:
- visnyk_KhPI_2024_02_DMM_Nekrasova_Metod_Monte_Karlo.pdf
- Розмір:
- 371.5 KB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 1.71 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: