Author:
Чусов А.А.,Чусова А.Е.,Смадыч Н.С.
Abstract
В работе представлены метод кастомизации локальности ввода-вывода при реализации высокопроизводительных методов обработки сигналов и данных на основе рекуррентных аффинных преобразований, а также обоснование параллельных алгоритмов такой обработки, включая векторный алгоритм, основанный на предлагаемом методе, с улучшенной локальностью доступа. Приведено формальное обоснование предложенного метода, использующее методы абстрактной алгебры, что делает метод применимым для широкого круга задач обработки сигналов и данных на основе рекуррентного аффинного преобразования. Применимость предложенного алгоритма обусловлена его принадлежностью классу «одна программа-множество данных», который реализуется широким набором вычислительных устройств, включая векторные, сигнальные и графические мультипроцессоры, вследствие относительной простоты организации и управления потоками выполнения. Использование предложенных метода и алгоритма показано на примерах генерации псевдослучайных чисел, реализации линейных и аффинных сдвиговых регистров с обратной связью, а также метода реализации блочного шифрования двумерных данных с помощью аффинных шифров, применяемых в современных методах сокрытия конфиденциальных изображений. Представленные результаты экспериментальных измерений показывают состоятельность и значительно бо̀льшую, по сравнению с новейшими альтернативами, оперативность даже последовательной реализации, а также масштабируемость параллельного алгоритма с улучшенной локальностью доступа.
The paper proposes a new method for customizing patterns of input-output access to data in order to improve its locality in implementations of high-performance signal and data processing based on recurrent affine transformation. This method is implemented in a proposed parallel algorithm with improved data locality which, together with alternative methods of parallelization, is formally described and presented in the paper. The formalism is expressed in terms of abstract algebraic structures and as such the method is applicable to a wide range of data and signal processing problems which are based on the recurrent affine transform. The applicability of the proposed algorithm is derived from its “single program-multiple data” class of parallel problems and implementing architectures. The latter are widespread due to relative simplicity of their implementation compared to other classes which require separate management of parallel threads of execution. These architectures include, for example, vector, signal and graphical multiprocessors. Use of the proposed method and algorithm, as an example, is specified in the paper for the problems of parallel generation of pseudorandom numbers, parallel implementation of linear and affine feedback registers as well as a parallel implementation of affine block and stream ciphers based on the recurrent affine transform which are employed in modern algorithms of confidential image encryption. The results of experimental research demonstrate efficiency and scalability of the proposed parallel algorithm which significantly outperform the newest alternatives.
Publisher
Marine Intellectual Technologies
Subject
General Materials Science