并行计算实验一

2021310752 刘丰源

项目构成

# config 目录下有所有作业基本要求的指令对应的配置文件
# eg: bash run.sh config/bcast.txt 8
bash run.sh {CFG_PATH} {NPROC}

用于解析 config 文件。

config example：

operation: all_reduce_sum
data_size: 10000000
root_id: 2

以冒号（:）为分隔符，前面的为变量名，后面的为变量值，可以自动扣除多余的空格。

在代码中加入了足量且详细的注释。

除了基础的带宽输出，还增加了数据正确性检查，会将发送的数组初始化成特定的值，并检查接收到的值是否符合预期，具体见 main.cpp:117 。

测试节点个数为 8 每次运行结果都有波动，记录内容为：去掉头尾的 10%，多次平均保留两位有效数字后取整

根结点把自己的数据发给所有人。

根节点接受所有人的信息。

gather 比 bacast 慢，是因为接收信息的结点压力太大有堵塞。

只有 ROOT 进程会收到数据。

所有进程都会收到算好的数据。

存在串行，所以较慢。

如果把数据排列成二维的结构，这个操作有点像矩阵转置。

Language:C++ 97.4%Language:Shell 2.6%