다음은 누리온 SKL노드(norm_skl 큐)을 활용한 Gromacs 테스트 샘플의 실행 방법 및 성능을 보여주는 예제이다.
Gromacs (2018.6 버전)의 실행 테스트를 위하여, 프로틴을 모델 시스템으로 사용하여 성능을 테스트하였다.
Copy $gmxBin grompp -f opls.mdp -c em20.gro -p topol.top -o md00.tpr
mpirun $gmxBin mdrun -notunepme -ntomp 1 -dlb yes -v -nsteps 40000 -resethway -noconfout -s ${WorkloadPath}/md00.tpr
Copy #!/bin/sh
#PBS -N 01N
#PBS -V
#PBS -l select=1:ncpus=40:mpiprocs=40:ompthreads=1
#PBS -q norm_skl
#PBS -l walltime=06:00:00
#PBS -A gromacs
#PBS -W sandbox=PRIVATE
module purge
module load craype-x86-skylake intel/18.0.3 impi/18.0.3 cmake/3.12.3
cd $PBS_O_WORKDIR
WorkloadPath = { 작업 경로}
InstallDir = { 설치 경로}/bin
gmxBin = "${InstallDir}/gmx_mpi"
$gmxBin grompp -f opls.mdp -c em20.gro -p topol.top -o md00.tpr
#$gmxBin grompp -f rf.mdp -c conf.gro -p topol.top -o topol_rf.tpr
export I_MPI_DEBUG = 5
export I_MPI_PIN_MODE = lib
time -p mpirun $gmxBin mdrun -notunepme -ntomp 1 -dlb yes -v -nsteps 40000 -resethway -noconfout -s ${WorkloadPath}/md00.tpr
Copy #!/bin/sh
#PBS -N 01N
#PBS -V
#PBS -l select=1:ncpus=40:mpiprocs=40:ompthreads=1
#PBS -q norm_skl
#PBS -l walltime=06:00:00
#PBS -A gromacs
#PBS -W sandbox=PRIVATE
module purge
module load craype-x86-skylake intel/18.0.3 impi/18.0.3 cmake/3.12.3
cd $PBS_O_WORKDIR
WorkloadPath = { 작업 경로}
InstallDir = { 설치 경로}/bin
gmxBin = "${InstallDir}/gmx_mpi"
$gmxBin grompp -f opls.mdp -c em20.gro -p topol.top -o md00.tpr
#$gmxBin grompp -f rf.mdp -c conf.gro -p topol.top -o topol_rf.tpr
export I_MPI_DEBUG = 5
export I_MPI_PIN_MODE = lib
time -p mpirun $gmxBin mdrun -notunepme -ntomp 1 -dlb yes -v -nsteps 40000 -resethway -noconfout -s ${WorkloadPath}/md00.tpr
Copy #PBS –l select=1:ncpus=40:mpiprocs=40:ompthreads=1
그림에서 보듯이 노드 수가 증가함에 따라 계산 시간이 감소하고 있음을 확인할 수 있다.
※ 누리온 KNL 노드, GPU 시스템 뉴론과의 성능 비교는 "누리온 Gromacs 멀티노드 활용(KNL)" 참조 (https://blog.ksc.re.kr/163?category=688349)