Please use this identifier to cite or link to this item: http://repository.kpi.kharkov.ua/handle/KhPI-Press/56404
Title: Дослідження узгодженості та продуктивності у нереляційних реплікованих базах даних
Other Titles: Research consistency and perfomance of nosql replicated databases
Authors: Карпенко, Андрій Сергійович
Тарасюк, Ольга Михайлівна
Горбенко, Анатолій Вікторович
Keywords: база даних Cassandra; теорема CAP; компроміс; Cassandra database; CAP theorem; compromise
Issue Date: 2021
Publisher: Національний технічний університет "Харківський політехнічний інститут"
Citation: Карпенко А. С. Дослідження узгодженості та продуктивності у нереляційних реплікованих базах даних / А. С. Карпенко, О. М. Тарасюк, А. В. Горбенко // Сучасні інформаційні системи = Advanced Information Systems. – 2021. – Т. 5, № 3. – С. 66-75.
Abstract: Метою даної статі є дослідження продуктивності розподілених відмовостійких інформаційних систем та нереляційних сховищ даних, а також аналізу впливу параметрів узгодженості даних на швидкодію та пропускну здатність на прикладі трьох-реплікованого кластеру Cassandra. Результати. У статті наведено результати наванта- жувального тестування (бенчмаркінгу) продуктивності операцій читання та запису кластера Cassandra, репліки якого було розгорнуто на ресурсах хмарного провайдера Amazon Web Services. Представлені кількісні результати показу- ють, як різні налаштування узгодженості впливають на продуктивність Cassandra під час різних робочих наванта- женнях в умовах, коли всі репліки розташовані в одному центрі обробки даних (ЦОД), або ж географічно розподілені по різним ЦОД. Висновок. Запропоновано метод мінімізації часових затримок Cassandra при гарантуванні строгої узгодженості даних на основі оптимізації налаштувань узгодженості в залежності від поточного робочого наванта- ження та пропорції між операціями читання та запису.
This paper evaluates performance of distributed fault-tolerant computer systems and replicated NoSQL databases and studies the impact of data consistency on performance and throughput on the example of a three-replicated Cassandra cluster. The paper presents results of heavy-load testing (benchmarking) of Cassandra cluster’s read and write performance which replicas were deployed on Amazon EC2 cloud. The presented quantitative results show how different consistency settings affect the performance of a Cassandra cluster under different workloads considering two deployment scenarios: when all cluster replicas are located in the sane data center, and when they are geographically distributed across different data centers (i.e. Amazon availability zones). We propose a new method of minimizing Cassandra response time while ensuring strong data consistency which is based on optimization of consistency settings depending on the current workload and the proportion between read and write operations.
ORCID: orcid.org/0000-0003-2789-1168
orcid.org/0000-0001-5991-8631
orcid.org/0000-0001-6757-1797
DOI: doi.org/10.20998/2522-9052.2021.3.09
URI: http://repository.kpi.kharkov.ua/handle/KhPI-Press/56404
Appears in Collections:Кафедра "Комп’ютерна інженерія та програмування"

Files in This Item:
File Description SizeFormat 
AIS_2021_5_3_Karpenko_Doslidzhennia.pdf1,4 MBAdobe PDFView/Open
Show full item record  Google Scholar



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.