基于FMM-PM方法的宇宙N体模拟在GPU上的实现和优化
扶月月,王武,王乔

The Implementation and Optimization of Cosmological N-Body Simulation by FMM-PM Method on GPUs
Yueyue Fu,Wu Wang,Qiao Wang
图11 不同MaxPackage三个CUDA实现版本程序的P2P函数加速倍数
Fig.11 P2P acceleration multiples of three CUDA versions of different MaxPackages