slurm 스케쥴러 기본 사용법 (2021.04)
슈퍼컴퓨팅인프라센터 2019. 6. 14. 15:00
가. 기본명령어 요약
나. sinfo
$ sinfo
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST
ivy_k40_2 up 5-00:00:00 4 idle gpu[01-03,07]
jupyter up 1-02:00:00 3 idle gpu[04-06]
ivy_v100_2 up 5-00:00:00 21 idle gpu[08-28]
ivy_v100-16G_2 up 5-00:00:00 11 idle gpu[08-18]
ivy_v100-32G_2 up 5-00:00:00 10 idle gpu[19-28]
cas_v100_2 up 5-00:00:00 14 idle gpu[30-41,43-44]
cas_v100nv_4 up 5-00:00:00 4 idle gpu[45-48]
cas32c_v100_2 up 5-00:00:00 5 idle gpu[54-58]
skl up 3-00:00:00 10 idle skl[01-10]
bigmem up 3-00:00:00 2 idle bigmem[01-02]
amd up 3-00:00:00 2 idle amd[01-02]
optane up 3-00:00:00 1 idle optane01다. sbatch
1. 작업스크립트 작성 안내
1) 작업 이름
2) 작업 파티션 이름
3) 필요한 자원의 양
4) output
5) error
6) comment
Application종류
SBATCH 옵션 이름
Application종류
SBATCH 옵션 이름
7) Wall Time Clock Limit
라. squeue
1. 제출된 작업 상세 조회
마. scancel
바. smap
사. 인터렉티브 작업 제출
1. 자원 할당
2. 작업 실행
3. 헤드 노드 접속
4. 진입한 노드에서 나가기 또는 자원 할당 취소
5. 커맨드를 통한 작업 삭제
Last updated