공유 노드 정책 변경에 따른 메모리 할당량 설정 안내
슈퍼컴퓨팅인프라센터 2022. 3. 31. 12:10
가. 뉴론 시스템 노드 정책 변경 안내
나. 뉴론 공유 노드 정책에서 메모리 할당량 설정
memory-per-node = ntasks-per-node * cpus-per-task * (단일 노드 메모리 가용량의 95% / 단일 노드 총 core 수)sbatch: error: Job submission failed due to 'CPU_cores_per_node(#cpu core 개수) < GPU_gres_per_node(#gpu 개수)'
sbatch: error: if 'CPU_cores_per_node >= GPU_gres_per_node' then job submission is successful!
…다. 뉴론 공유 노드 정책에서 GPU 당 CPU core 할당 개수 설정
라. 제출 작업의 메모리 사용량 확인 방법 예시
1) 작업이 수행중인 계산노드 확인
2) ssh 명령으로 계산노드 접속
3) 이후 top, nvidia-smi, htop, nvtop 등의 명령으로 자원 사용량에 대해 확인
(htop, nvtop은 module load nvtop htop 후 사용 가능)
마. 작업 스크립트 예시
1. 프로그램 실행에 사용할 core 수는 적으나, 메모리 사용량이 큰 경우 노드당 수행될 프로세스 수로 메모리 할당량을 조절하여 프로그램 실행하는 예제
2. #SBATCH –exclusive 설정으로 노드를 전용으로 사용하는 예시
Last updated