Conda 기반 Horovod 설치 방법
가. Tensorflow-horovod 설치
1. 콘다 환경 생성
$ module load gcc/10.2.0 cuda/11.4 cudampi/openmpi-4.1.1 python/3.7.1 cmake/3.16.9
$ conda create -n my_tensorflow
$ source activate my_tensorflow
(my_tensorflow) $2. Tensorflow 설치 및 horovod 설치
(my_tensorflow) $ conda install tensorflow-gpu=2.0.0 tensorboard=2.0.0 tensorflow-estimator=2.0.0 python=3.7 cudnn cudatoolkit=10 nccl=2.8.3
(my_tensorflow) $ HOROVOD_WITH_MPI=1 HOROVOD_GPU_OPERATIONS=NCCL HOROVOD_NCCL_LINK=SHARED HOROVOD_WITH_TENSORFLOW=1 \
pip install --no-cache-dir horovod==0.23.03. Horovod 설치 확인
(my_tensorflow) $ pip list | grep horovod
horovod 0.23.0
(my_tensorflow) $ python
>>> import horovod
>>> horovod.__version__
'0.23.0'4. Horovod 실행 예시
1) interactive 실행 예시
2) batch 스크립트 실행 예시
나. Pytorch-horovod 설치
1. 콘다 환경 생성
2. Pytorch 설치 및 horovod 설치
3. Horovod 설치 확인
4. Horovod 실행 예시
1) interactive 실행 예시
2) batch 스크립트 실행 예시
Last updated