Дослідження узгодженості та продуктивності у нереляційних реплікованих базах даних

Loading...
Thumbnail Image

Date

item.page.thesis.degree.name

item.page.thesis.degree.level

item.page.thesis.degree.discipline

item.page.thesis.degree.department

item.page.thesis.degree.grantor

item.page.thesis.degree.advisor

item.page.thesis.degree.committeeMember

Journal Title

Journal ISSN

Volume Title

Publisher

Національний технічний університет "Харківський політехнічний інститут"

Abstract

Метою даної статі є дослідження продуктивності розподілених відмовостійких інформаційних систем та нереляційних сховищ даних, а також аналізу впливу параметрів узгодженості даних на швидкодію та пропускну здатність на прикладі трьох-реплікованого кластеру Cassandra. Результати. У статті наведено результати наванта- жувального тестування (бенчмаркінгу) продуктивності операцій читання та запису кластера Cassandra, репліки якого було розгорнуто на ресурсах хмарного провайдера Amazon Web Services. Представлені кількісні результати показу- ють, як різні налаштування узгодженості впливають на продуктивність Cassandra під час різних робочих наванта- женнях в умовах, коли всі репліки розташовані в одному центрі обробки даних (ЦОД), або ж географічно розподілені по різним ЦОД. Висновок. Запропоновано метод мінімізації часових затримок Cassandra при гарантуванні строгої узгодженості даних на основі оптимізації налаштувань узгодженості в залежності від поточного робочого наванта- ження та пропорції між операціями читання та запису.
This paper evaluates performance of distributed fault-tolerant computer systems and replicated NoSQL databases and studies the impact of data consistency on performance and throughput on the example of a three-replicated Cassandra cluster. The paper presents results of heavy-load testing (benchmarking) of Cassandra cluster’s read and write performance which replicas were deployed on Amazon EC2 cloud. The presented quantitative results show how different consistency settings affect the performance of a Cassandra cluster under different workloads considering two deployment scenarios: when all cluster replicas are located in the sane data center, and when they are geographically distributed across different data centers (i.e. Amazon availability zones). We propose a new method of minimizing Cassandra response time while ensuring strong data consistency which is based on optimization of consistency settings depending on the current workload and the proportion between read and write operations.

Description

Citation

Карпенко А. С. Дослідження узгодженості та продуктивності у нереляційних реплікованих базах даних / А. С. Карпенко, О. М. Тарасюк, А. В. Горбенко // Сучасні інформаційні системи = Advanced Information Systems. – 2021. – Т. 5, № 3. – С. 66-75.

Endorsement

Review

Supplemented By

Referenced By