Использование разделяемой памяти платформы CUDA в параллельной реализации искусственной нейронной сети прямого распространения

Ескіз

Дата

2011

ORCID

DOI

Науковий ступінь

Рівень дисертації

Шифр та назва спеціальності

Рада захисту

Установа захисту

Науковий керівник

Члени комітету

Назва журналу

Номер ISSN

Назва тому

Видавець

НТУ "ХПИ"

Анотація

В статье рассматриваются влияние способа использования разделяемой памяти на производительность реализации искусственной нейронной сети на платформе CUDA. Рассматриваются варианты размещения нескольких окон исходных данных и весовых коэффициентов в разделяемой памяти. Показано, что из-за нерационального использования времени ожидания загрузки данных из глобальной памяти производительность этих вариантов не превосходит производительности базовой схемы распараллеливания.
The performance of several schemes of shared memory usage in artificial neural network implementation on a CUDA platform is considered. The placement of several windows of input data and neuron inputs weights in shared memory is investigated. It is shown, that due to waiting while data is loaded from global memory, performance of these schemes doesn’t exceed the performance of basic scheme of parallelization.

Опис

Ключові слова

процессор, видеокарта, вычисления неграфические, обработка данных

Бібліографічний опис

Колбасин В. А. Использование разделяемой памяти платформы CUDA в параллельной реализации искусственной нейронной сети прямого распространения / В. А. Колбасин // Вестник Нац. техн. ун-та "ХПИ" : сб. науч. тр. Темат. вып. : Системный анализ, управление и информационные технологии. – Харьков : НТУ "ХПИ". – 2011. – № 35. – С. 43-46.

Підтвердження

Рецензія

Додано до

Згадується в