뉴론 지침서
초보 사용자 가이드누리온 지침서뉴론 지침서활용정보MyKSC 지침서
  • 뉴론 지침서
  • 1️⃣시스템
    • 시스템 개요 및 구성
    • 사용자 환경
    • 사용자 프로그래밍 환경
    • 스케줄러(SLURM)를 통한 작업 실행
    • 사용자 지원
  • 2️⃣소프트웨어
    • 가우시안16(Gaussian16) on GPU
  • 3️⃣부록
    • 작업 스크립트 주요 키워드
    • Conda
    • Singularity 컨테이너
    • Lustre striping
    • 뉴론 Jupyter
    • Keras 기반 Multi GPU 사용법
    • Conda 기반 Horovod 설치 방법
    • 딥러닝 프레임워크 병렬화 (Horovod)
    • AI 멀티노드 활용
  • External Link
    • Nurion Guide(Eng)
    • Neuron Guide(Eng)
Powered by GitBook
On this page
  • 가. Neuron Lustre Striping 기본 설정
  • 나. Lustre Striping 개념
  • 다. Stripe 설정 및 확인
  • 라. 권장사항 및 팁
  1. 부록

Lustre striping

PreviousSingularity 컨테이너Next뉴론 Jupyter

Last updated 1 year ago

가. Neuron Lustre Striping 기본 설정

Neuron Lustre File system은 File Striping을 지원하며, 이를 위해 복수 개의 OST(Object Storage Target, 즉 물리적으로 분산되어 있는 여러 디스크)에 하나의 파일을 분산시켜 저장함으로써 병목을 줄이고 I/O 성능을 향상시킬 수 있다. 특히, Lustre 2.10부터 지원되는 PFL(Progressive File Layout)이 /scratch 파일시스템에 적용되어 있다. 이 기능은 사용자가 별도의 striping 설정 없이 파일의 크기에 따라 stripe-count 개수가 자동으로 적용되어 I/O의 성능을 향상시킬 수 있다. Neuron 파일 시스템의 striping 설정은 아래와 같다

나. Lustre Striping 개념

Lustre는 각 OST별로 자료를 분할하여 대용량 파일에 대한 I/O 성능을 최대화 할 수 있으며, 병렬화가 유효한 최대 분할 수는 OST 숫자와 같다. 단일 파일 역시 위 그림과 같이 Lustre Striping 기능을 사용하여 OST에 병렬로 저장 함

다. Stripe 설정 및 확인

$ lfs setstripe [--stripe-size|-s size] [--stripe-count|-c count] filename|dirname
  • 파일 또는 디렉터리에 striping 설정을 적용시키는 명령어. 위 명령으로 생성된 파일이나 위 명령이 적용된 디렉터리에서 생성되는 모든 파일은 striping 설정 적용

    • --stripe-size

      • 각 OST에 저장할 데이터의 크기를 설정

      • 지정된 크기만큼 저장하면 다음 OST에 데이터를 저장

      • 기본 값은 1MB이며 stripe_size를 0으로 설정하면 기본 값을 사용함

      • stripe_size는 반드시 64KB의 배수로 설정해야 하며 4GB보다 작아야 함

    • --stripe-count

      • Striping에 사용할 OST 개수를 설정

      • 기본 값은 1이며 stripe_count를 0으로 설정하면 기본 값을 사용

      • stripe_count가 –1이면 가능한 모든 OST들을 사용

$ lfs getstripe filename|dirname

※ 파일 또는 디렉터리에 적용된 striping 설정 값을 확인하는 명령어

라. 권장사항 및 팁

  • 작업 스크립트 내에서 모델의 결과파일이 저장될 디렉터리에 대해 setstripe를 지정하면, 이후 생성되는 하위 디렉터리 및 파일은 모두 해당 설정 값 상속

  • --stripe-count는 파일 사이즈가 1GB 이상인 파일에 대해 4로 설정 시 대부분 성능 향상. 더 큰 값 사용 시 테스트 필요

  • --stripe-size는 파일 사이즈가 수 TB 이상인 파일인 경우에만 유효하므로 대부분 default 값을 사용해도 문제없음

2022년 9월 22일에 마지막으로 업데이트되었습니다.

3️⃣