Дослідження узгодженості та продуктивності у нереляційних реплікованих базах даних

Вантажиться...
Ескіз

Дата

2021

DOI

doi.org/10.20998/2522-9052.2021.3.09

Науковий ступінь

Рівень дисертації

Шифр та назва спеціальності

Рада захисту

Установа захисту

Науковий керівник

Члени комітету

Видавець

Національний технічний університет "Харківський політехнічний інститут"

Анотація

Метою даної статі є дослідження продуктивності розподілених відмовостійких інформаційних систем та нереляційних сховищ даних, а також аналізу впливу параметрів узгодженості даних на швидкодію та пропускну здатність на прикладі трьох-реплікованого кластеру Cassandra. Результати. У статті наведено результати наванта- жувального тестування (бенчмаркінгу) продуктивності операцій читання та запису кластера Cassandra, репліки якого було розгорнуто на ресурсах хмарного провайдера Amazon Web Services. Представлені кількісні результати показу- ють, як різні налаштування узгодженості впливають на продуктивність Cassandra під час різних робочих наванта- женнях в умовах, коли всі репліки розташовані в одному центрі обробки даних (ЦОД), або ж географічно розподілені по різним ЦОД. Висновок. Запропоновано метод мінімізації часових затримок Cassandra при гарантуванні строгої узгодженості даних на основі оптимізації налаштувань узгодженості в залежності від поточного робочого наванта- ження та пропорції між операціями читання та запису.
This paper evaluates performance of distributed fault-tolerant computer systems and replicated NoSQL databases and studies the impact of data consistency on performance and throughput on the example of a three-replicated Cassandra cluster. The paper presents results of heavy-load testing (benchmarking) of Cassandra cluster’s read and write performance which replicas were deployed on Amazon EC2 cloud. The presented quantitative results show how different consistency settings affect the performance of a Cassandra cluster under different workloads considering two deployment scenarios: when all cluster replicas are located in the sane data center, and when they are geographically distributed across different data centers (i.e. Amazon availability zones). We propose a new method of minimizing Cassandra response time while ensuring strong data consistency which is based on optimization of consistency settings depending on the current workload and the proportion between read and write operations.

Опис

Ключові слова

база даних Cassandra, теорема CAP, компроміс, Cassandra database, CAP theorem, compromise

Бібліографічний опис

Карпенко А. С. Дослідження узгодженості та продуктивності у нереляційних реплікованих базах даних / А. С. Карпенко, О. М. Тарасюк, А. В. Горбенко // Сучасні інформаційні системи = Advanced Information Systems. – 2021. – Т. 5, № 3. – С. 66-75.