Ефективна реалізація матричного множення для великих мовних моделей на CUDA
Вантажиться...
Дата
ORCID
DOI
Науковий ступінь
Рівень дисертації
Шифр та назва спеціальності
Рада захисту
Установа захисту
Науковий керівник/консультант
Члени комітету
Назва журналу
Номер ISSN
Назва тому
Видавець
Національний технічний університет "Харківський політехнічний інститут"
Анотація
Опис
Ключові слова
матричне множення, мовні моделі, штучний інтелект, ядра CUDA, квантування вагових коефіцієнтів, деквантування, кешування вхідних даних
Бібліографічний опис
Сальніков Д. В. Ефективна реалізація матричного множення для великих мовних моделей на CUDA [Електронний ресурс] / Д. В. Сальніков, О. Г. Васильченков // Інформаційні технології: наука, техніка, технологія, освіта, здоров'я = Information technologies: science, engineering, technology, education, health : тези доп. 33-ї міжнар. наук.-практ. конф. MicroCAD-2025, 14-17 травня 2025 р. / ред. Є. І. Сокол ; уклад. Г. В. Лісачук ; Нац. техн. ун-т "Харків. політехн. ін-т" [та ін.]. – Електрон. текст. дані. – Харків : НТУ "ХПІ", 2025. – С. 648.
