%0 Journal Article %A 戴志涛 %A 黄智濒 %A 汤洋 %A 赵达非 %T 高性能行任务散列法GPU一般稀疏矩阵-矩阵乘法 %D 2019 %R 10.13190/j.jbupt.2018-252 %J 北京邮电大学学报 %P 106-113 %V 42 %N 3 %X 针对一般稀疏矩阵-矩阵乘法(SpGEMM)的性能问题,提出了一种基于任务分类和低延迟散列表的图形处理器上的加速SpGEMM算法RBSPARSE.该算法由一种低成本子任务复杂度预分析方法和一种低延迟共享内存上的散列表的方法组成,以达到最大效率.通过解决负载均衡和内存延迟问题,RBSPARSE可以显著减少计算的总时间.比较了RBSparse和BHSparse,前者是最快的SpGEMM算法,结果表明RBSparse的性能是BHSparse的平均3.1倍,在最佳情况下可达到14.49倍. %U https://journal.bupt.edu.cn/CN/10.13190/j.jbupt.2018-252