cmh程序设计期末大作业

概述

对n by n个三维格点进行积分，实际上是一个五层的循环，在第三层以后加上#pragma omp for collapse(3) reduction(+, sum)其实就有尚可的效率了。

注意到每个三维格点的数据只集中在以分布函数的截断长度r为半径，以对应三维空间的点为球心的球中，我们只需要对这一部分（或者是2r by 2r by 2r的一个盒子）的格点进行积分。这是一个很强的优化。

只考虑效率因素，不是很必要使用MPI。

并行的设计本身不是难点，难点在于ScaLAPACK的使用。

可以参考的是一个Github项目：ScaLAPACK Example。名义上是C++项目，实际上除了输入输出外，几乎都是C代码。把他改成一个并行加速的对角化函数（C语言）留作练习（雾）。

ScaLAPACK函数相关的文档，我找到的最好的是IBM Parallel ESSL的文档，里面给出了详细的参数解释和样例。

Netlib的文档基本上约等于没有，文档写在注释里面，并且非常难读，我也没有找到示例。ScaLAPACK是一个Fortran 77库，类似函数的功能叫subroutine。Fortran的传参都是实参，对应C/C++都是指针，在函数内部就可以对传入参数进行修改。这一点在调用参数时需要注意。

先说这些，可能以后聊聊Fortran吧（不要让我真的写Fortran 77代码）。

（被正态了，悲）