HPC | Introduction to Parallel Computation

Andrew-Rey

2024-04-09 (Updated: 2024-04-11)

HPC3

Parallel Programming: Concepts and Pracitce - Chapter 1

概念

加速比 Speedup：衡量一个并行算法比串行算法快多少的指标。即使用单个处理器运行程序所花费的时间与使用个处理器运行程序所花费的时间之比

通常我们希望得到的加速比为线性加速比，即用个处理器去运行程序，最大的加速比为

效率 Efficiency：定义为加速比和处理器数目之比，衡量了平均一个处理器带来的加速比。当效率为时，此时为线性加速比

可扩展性 Scalability：分为强可扩展性和弱可扩展性。

计算通信比 Computation-to-communication Ratio：定义为计算花费的时间和处理器间处理消息通信花费的时间之比。

分布式内存系统：每个计算单元只能访问自己的本地内存，如果需要访问其它单元，需要通过一个显式的通信步骤（例如通信网络）实现。

共享式内存系统：所有计算单元共享内存，除此之外，自己本身也有更小的内存（分级缓存）。

并行程序设计时需要考虑划分（数据并行、任务并行、模型并行）、通信、同步和负载平衡等。

现在我们进行一组数据的加法求和操作，其中数据量为，处理器数量为。设为一次加法操作所需要的时长，为一批数据的通信时长。则

总的求和运行时长为

其加速比为

对于固定的，加速比只与计算通信比有关，并且有

因此在固定数据规模和处理器数量时，要提高加速比，需要降低计算通信比。同时，加速比也可以是处理器数量的函数：

令偏导为，解出最值条件

综上所述，有如下规律：

当数据规模固定时，加速比依赖于采用的计算单元的数目和计算通信比
- 通常情况下，加速比随着计算单元的增加达到局部最大，但使用更多计算单元时，加速比会降低
- 最优的加速比依赖于计算通信比，通信时长占比越大，使用的计算单元数目应该越少

前缀和问题：现有个数据和个计算结点

由于计算需要依赖，在循环分析时带来了一定的困难，但该问题依然有并行的方式。

前缀和问题将在后续进行更加详细的讨论。