Technology for executing retrieval queries to a database based on the CW-tree data indexing method

Author:

Шевский В.С.,Шичкина Ю.А.

Abstract

На сегодняшний день в информационных технологиях наблюдается тенденция к многократному увеличению объемов хранимых данных. Наращивание объемов данных обусловлено глобальной цифровизацией различных сфер жизнедеятельности человека, распространения использования датчиков мониторинга, диагностирования и управления различными объектами. Несмотря на растущие объемы, по-прежнему требуется обработка данных. Методы обработки включают важный этап поиска, скорость выполнения которого сказывается на эффективности всей обработки. Поэтому разработки в области ускоренного поиска необходимых данных для интеллектуального анализа в различных базах данных являются актуальными. В данной статье предлагается разработанный авторами алгоритм на основе структуры данных CW-tree, который позволяет индексировать данные, максимально используя возможности вычислительной системы в условиях многопоточной обработки запросов. Структура данных CW-tree, также предложенная авторами, содержит два уровня: уровень ветвей, который предназначен для поиска вершины по заданному в запросе пользователем условию, и уровень листьев, который предназначен для хранения данных. В настоящей работе описан метод прохода по уровню листьев CW-tree при выполнении поискового запроса к базе данных. Также приведены результаты тестирования предложенного метода на тестовой базе данных, результаты сравнительного анализа выполнения поисковых запросов к базе данных, основанной на структуре CW-tree, и базе данных под управлением СУБД MySQL. There is a tendency to multiplying the volume of stored data in information technology today. The increase in data volumes is due to the global digitalization of various spheres of human life, the expansion of using sensors for monitoring, diagnosing, and controlling diverse objects. Despite the growing volumes, data still needs to be processed. Processing methods include an important retrieval step which speed affects the efficiency of the entire processing. Therefore, developments in the field of accelerated retrieval for the necessary data for mining in various databases are relevant. This article proposes an algorithm developed by the authors based on the CW-tree data structure. It allows data to be indexed by maximizing the capabilities of a computing system in conditions of multithreaded query processing. The CW-tree data structure, also proposed by the authors, contains two levels. The branch level is designed to retrieve a vertex according to a user-specified query. The leaf level is used to store data. This paper describes a method for traversing the CW-tree leaf-level when executing a retrieval query to the database. Test results of the proposed method on a test database are also given, the results of a comparative analysis of the execution of retrieval queries to a database based on the CW-tree structure and a database controlled by the MySQL DBMS are presented. Keywords: database management systems, tree algorithms, data indexing, multithreading, database query optimization, CW-tree.

Publisher

Voronezh Institute of High Technologies

Reference17 articles.

1. Research and Markets. The world’s largest market research store. Доступен по: https://www.researchandmarkets.com (дата обращения: 05.02.2021)

2. Reinsel D., Gantz J., Rydning J. The Digitization of the World From Edge to Core. Framingham: International Data Corporation. 2018. Доступно по: https://www.seagate.com/files/www-content/our-story/trends/files/idc-seagate-dataage-whitepaper.pdf (дата обращения: 05.02.2021)

3. Vladislav Shevskiy. Constantly Wide Tree for Parallel Processing. 2019 Information Systems and Technologies in Modeling and Control on CEUR-WS.org (ISSN 1613-0073). ISTMC 2019 Conference. 2019;50-56.

4. Berchtold S.; Keim D.A., Kriegel H-P. The X-Tree: An Index Structure for High-Dimensional Data. Readings in multimedia computing and networking. 2001;451.

5. Wang X., Meng W., Zhang M. A novel information retrieval method based on R-tree index for smart hospital information system. International Journal of Advanced Computer Research. 2019;9(42):133-45. DOI: 10.19101/IJACR.2019.940030.

同舟云学术

1.学者识别学者识别

2.学术分析学术分析

3.人才评估人才评估

"同舟云学术"是以全球学者为主线,采集、加工和组织学术论文而形成的新型学术文献查询和分析系统,可以对全球学者进行文献检索和人才价值评估。用户可以通过关注某些学科领域的顶尖人物而持续追踪该领域的学科进展和研究前沿。经过近期的数据扩容,当前同舟云学术共收录了国内外主流学术期刊6万余种,收集的期刊论文及会议论文总量共计约1.5亿篇,并以每天添加12000余篇中外论文的速度递增。我们也可以为用户提供个性化、定制化的学者数据。欢迎来电咨询!咨询电话:010-8811{复制后删除}0370

www.globalauthorid.com

TOP

Copyright © 2019-2024 北京同舟云网络信息技术有限公司
京公网安备11010802033243号  京ICP备18003416号-3