2024 № 2 Динаміка та міцність машин

Зараз показуємо 1 - 2 з 2

Застосування багатоіндикаторної оцінки якості Парето-апроксимації при прийнятті мультикритеріальних рішень
(Національний технічний університет "Харківський політехнічний інститут", 2024) Некрасова, Марія Володимирівна
Підтримка прийняття багатокритеріальних рішень на основі багатоіндикаторної оцінки якості Парето-апроксимації є важливою задачею у галузі багатокритеріальної оптимізації. Така оцінка дозволяє приймати більш обґрунтовані та точні рішення, використовуючи інформацію про декілька показників, що визначають якість рішень. Парето-апроксимація - це наближений набір рішень, який прагне якнайточніше описати реальний Парето-фронт. При цьому слід оцінювати, наскільки добре знайдені рішення покривають або апроксимують реальний Парето-фронт. З великої кількості відомих алгоритмів розв'язання цієї задачі можна назвати алгоритми, засновані на попередній побудові апроксимації її фронту (множини) Парето і звані П-алгоритмами. П-алгоритми можуть бути побудовані на основі еволюційних і насамперед на основі генетичних алгоритмів, а також на основі роєвих алгоритмів глобальної оптимізації, таких як алгоритми рою частинок, колонії мурах, медоносних бджіл і т.д. Зважаючи на наявність великої кількості П-алгоритмів виникає проблема вибору «найкращого» алгоритму для даної багатокритеріальної задачі оптимізації (БКО-задачі) - проблема метаоптимізації. У зв'язку з цим розроблено значну кількість індикаторів ефективності П-алгоритмів (П- індикаторів), які засновані насамперед на оцінці якості отриманої апроксимації фронту (множини) Парето (П-апроксимації). Таким чином, задача оцінки якості П-алгоритму сама стає багатокритеріальною, точніше кажучи, багатоіндикаторною.
Метод Монте-Карло та штучний інтелект: використання методу Монте-Карло в навчанні з підкріпленням
(Національний технічний університет "Харківський політехнічний інститут", 2024) Некрасова, Марія Володимирівна
Навчання з підкріпленням - технологія, що найбільш швидко розвивається, застосовується при створенні штучних інтелектуальних систем. На даний момент ця галузь досить швидко розвивається і є надзвичайно затребуваною.. Багато дослідників по всьому світу активно працюють з навчанням з підкріпленням у різноманітних сферах: нейробіології, теорії управління, психології та багатьох інших. Метою даної роботи є обґрунтування можливості застосування методу Монте-Карло в навчанні з підкріпленням. Відомо, що основним у такому навчанні є фіксація аспектів реальної проблеми при взаємодії того, хто навчається з навколишнім світом для досягнення своєї мети. Тобто агент навчання повинен мати мету, пов’язану зі станом навколишнього середовища. Також необхідно мати можливість відчувати середовище та вчиняти дії, що впливають на нього. Формулювання завдання навчання з підкріпленням має враховувати все три аспекти – відчуття, дію та мету – у їх найпростіших формах. В статті показано, що методи Монте-Карло здатні вирішити проблеми навчання із підкріпленням, ґрунтуючись на усередненні результатів вибірки. Не можна використовувати лише перевірені дії або лише шукати нові - в цьому і полягає проблема, бо у стохастичній задачі кожна дія має бути випробувана багато разів, щоб отримати надійну оцінку очікуваної винагороди. Щоб забезпечити доступність чітко визначених результатів, у статті розглядаються методи Монте-Карло лише епізодичних завдань. При цьому показане застосування нестандартного підходу до навчання із заздалегідь невідомими навчальними прикладами, які підбиралися автоматично, у процесі оптимізації. Таким чином, методи Монте-Карло можуть бути успішно інкрементними лише на рівні епізодів.

2024 № 2 Динаміка та міцність машин

Переглянути

Фільтри

Налаштування

Сортувати за

Результатів на сторінку

Результати пошуку