Multiple-precision matrix-vector multiplication on graphics processing units-Reference-Cited by-同舟云学术

Multiple-precision matrix-vector multiplication on graphics processing units

Published:2020-08-20 Issue:3 Volume:11 Page:33-59
ISSN:2079-3316
Container-title:Program Systems: Theory and Applications
language:ru
Short-container-title:ПСТП

Author:

Исупов Константин Сергеевич¹^ORCID,Князьков Владимир Сергеевич²^ORCID

Affiliation:

1. Вятский государственный университет

2. Пензенский государственный университет

Abstract

Мы рассматриваем параллельную реализацию матрично/векторного умножения (GEMV, уровень 2 BLAS) для графических процессоров (GPU) с использованием арифметики многократной точности на основе системы остаточных классов. В нашей реализации GEMV покомпонентные операции с многоразрядными векторами и матрицами разбиваются на части, каждая из которых выполняется отдельным CUDA ядром. Это исключает ветвление логики исполнения и позволяет добиться более полного использования ресурсов GPU. Эффективная структура данных для хранения многоразрядных массивов обеспечивает объединение доступов параллельных потоков к глобальной памяти GPU в транзакции. Для предложенной реализации GEMV выполнен анализ ошибок округления и получены оценки точности. Представлены экспериментальные результаты, показывающие высокую эффективность разработанной реализации по сравнению с существующими программными пакетами многократной точности для GPU.

Publisher

Ailamazyan Program Systems Institute of Russian Academy of Sciences (PSI RAS)

Subject

General Computer Science

Reference29 articles.

1. M. Courbariaux, Y. Bengio, J. David. Training deep neural networks with low precision multiplications, 2014.

2. High-Precision Arithmetic in Mathematical Physics

3. Numerical aspects of integration in semi-closed option pricing formulas for stochastic volatility jump diffusion models

4. The PSLQ algorithm for empirical data

5. Fast arbitrary order moments and arbitrary precision solution of the general rate model of column liquid chromatography with linear isotherm

Cited by 1 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Digit-wise parallelism of addition of real numbers due to redundancy of representation;Proceedings of 22nd Scientific Conference “Scientific Services & Internet – 2020”;2020