Ефективна реалізація матричного множення для великих мовних моделей на CUDA

Вантажиться...
Ескіз

Дата

ORCID

DOI

Науковий ступінь

Рівень дисертації

Шифр та назва спеціальності

Рада захисту

Установа захисту

Науковий керівник/консультант

Члени комітету

Назва журналу

Номер ISSN

Назва тому

Видавець

Національний технічний університет "Харківський політехнічний інститут"

Анотація

Опис

Ключові слова

матричне множення, мовні моделі, штучний інтелект, ядра CUDA, квантування вагових коефіцієнтів, деквантування, кешування вхідних даних

Бібліографічний опис

Сальніков Д. В. Ефективна реалізація матричного множення для великих мовних моделей на CUDA [Електронний ресурс] / Д. В. Сальніков, О. Г. Васильченков // Інформаційні технології: наука, техніка, технологія, освіта, здоров'я = Information technologies: science, engineering, technology, education, health : тези доп. 33-ї міжнар. наук.-практ. конф. MicroCAD-2025, 14-17 травня 2025 р. / ред. Є. І. Сокол ; уклад. Г. В. Лісачук ; Нац. техн. ун-т "Харків. політехн. ін-т" [та ін.]. – Електрон. текст. дані. – Харків : НТУ "ХПІ", 2025. – С. 648.

Підтвердження

Рецензія

Додано до

Згадується в