Author:
Mochalov V.P.,Bratchenko N.Y.,Linets G.I.,Palkanov I.S.
Abstract
The object of the research is computing clusters of cloud data centers, containing many servers, data storage systems, an input-output system interconnected by a communication network. The goal of this research is to develop methods and models for improving the performance of a data center cluster by reducing the processing time of service requests as well as reducing equipment costs due to the efficient allocation of its resources. Therefore, it is necessary to implement optimization algorithms for placing virtual machines (VMs) on physical servers in real time based on load balancing. The proposed method of resource allocation is based on an iterative greedy algorithm and a limited search procedure. Reduction in the computation time is achieved by introducing restrictions on the permissible search depth. The paper puts forward a mathematical model of resource allocation, built using the Erlang model in the form of a multi-line m-node queuing system (QS) of the type with an n-seat buffer, which makes it possible to determine the main indicators of service request quality in the form of QS parameters. The efficiency of this approach was tested on a simulation model built on the basis of the system functioning statistical analysis. Its experimental study was also carried out.
Объектом исследования являются вычислительные кластеры облачных центров обработки данных (ЦОД), содержащие множество серверов, систем хранения данных, систему ввода-вывода связанных между собой коммуникационной сетью. Целью работы является разработка методов и моделей повышения производительности кластера ЦОД путем уменьшения времени обработки запросов на обслуживание, а также уменьшения затрат на оборудование за счет эффективного распределения его ресурсов. Это вызывает необходимость реализации оптимизационных алгоритмов размещения виртуальных машин (ВМ) на физических серверах в реальном времени на основе балансировки нагрузки. В основу предложенного метода распределения ресурсов положен итерационный жадный алгоритм и процедура ограниченного перебора. Сокращение времени вычислений достигается при этом путем введения ограничений на допустимую глубину перебора. В работе предложена математическая модель распределения ресурсов, построенная на основе модели Эрланга в виде многолинейной m-узловой системы массового обслуживания (СМО) типа с n-местным буфером, позволяющая определять основные показатели качества обслуживания запросов в виде параметров СМО. Работоспособность предложенного подхода проверена на имитационной модели, построенной на основе статистического анализа функционирования системы, проведено ее экспериментальное исследование.
Publisher
Voronezh Institute of High Technologies
Reference27 articles.
1. Gnedenko B.V., Kovalenko I.N. Introduction to queuing theory. LCI Publisher; 2007. 400 p.
2. Aliev T.I. Fundamentals of modeling of discrete systems. St. Petersburg, ITMO; 2009. 363 p.
3. Feller E., Rilling L., Morin C. A scalable and autonomic virtual machine management framework for private Clouds. Proceedings of the 12th IEEE/ACMInternational Symposium on Cluster, Cloud and Grid Computing (CCGrid). 2021:482–489.
4. Ward J.S., Barker A. Cloud cover: monitoring large-scale clouds with Varanus. Journal of Cloud Computing: Advances, Systems and Applications, 2015;4:127–135.
5. Kleinrock L.. Queueing Theory. Mashinostroenie; 1979. 432 p.