📔
활용정보
초보사용자 가이드누리온 지침서뉴론 지침서활용정보MyKSC 지침서
  • 활용정보
  • 1️⃣소프트웨어 설치
    • 누리온
      • LAMMPS
        • lammps-2Aug2023 설치 소개
        • lammps-3Mar20 설치 소개(SKL)
        • lammps-3Mar20 설치 소개(KNL)
        • lammps-12Dec18 설치 소개
      • GROMACS
        • GROMACS-2021.4 버전 설치 소개 (SKL)
        • GROMACS-2021.4 버전 설치 소개 (KNL)
        • GROMACS-2020.2 버전 설치 소개 (KNL)
        • GROMACS-2020.2 버전 설치 소개 (SKL)
        • GROMACS-2018.6 버전 설치 소개 (KNL)
        • GROMACS-2018.6 버전 설치 소개 (SKL)
        • GROMACS-5.1.4 설치
      • Quantum Espresso
        • Quantum Espresso-7.2 설치 소개
        • Quantum Espresso-6.6 설치 소개
        • Quantum Espresso-6.2.1 설치 소개
      • OpenFOAM
        • OpenFOAM-v1912 설치 소개
        • OpenFOAM-v1712 설치 소개
        • OpenFOAM-7 버전 설치 소개(SKL)
        • OpenFOAM-7 버전 설치 소개(KNL)
        • OpenFOAM-5.x 버전 설치 소개(SKL)
        • OpenFOAM-5.x 버전 설치 소개(KNL)
      • VASP
        • VASP 6.5.0 설치 소개
        • VASP 6.1.0 설치 소개
        • VASP 5.4.4 설치 (KNL)
        • VASP 5.4.4 설치 (SKL)
        • VASP 5.3.5 설치
      • 누리온 R-3.6.2 버전 설치 소개
      • CP2K
        • CP2K-6.1.0 버전 설치 소개
        • CP2K-5.1.0 버전 설치 소개
      • SIESTA
        • SIESTA 4.1-b3 설치(KNL)
        • SIESTA 4.1-b3 설치(SKL)
      • WRF-V3.9.1.1 설치
      • RASPA v2.0.47 설치 소개
      • gcc v8.1.0 설치
      • UPP v3.1 설치 소개
      • mpiP v3.4.1 설치 소개
      • V_Sim v3.7.2 설치 소개
      • foam-extend v3.1 설치 소개
      • ParaView v5.2.0 설치 소개
      • AutoDock Vina v1.1.2 설치 소개
      • DDSCAT v7.3.3 설치 소개
    • 뉴론
      • VASP
        • VASP 6.4.3 설치 (GPU)
        • VASP 5.4.4 설치 (GPU)
      • GROMACS
        • GROMACS-2018.6 (GPU 버전) 설치
        • GROMACS-2016.4 (GPU 버전) 설치
      • LAMMPS
        • lammps-16Mar18 (GPU 버전) 설치
      • NAMD 2.12 (GPU 버전) 설치
      • Quantum Espresso
        • Quantum Espresso-7.3 (GPU 버전) 설치
        • Quantum Espresso-6.6 (GPU 버전) 설치
        • Quantum Espresso-6.4 (GPU 버전) 설치
      • OpenFOAM-v1912 설치 소개 (SKL)
  • 2️⃣슈퍼컴퓨터 활용 팁
    • 공통
      • oneAPI 소개
      • AMD Instinct MI100 GPU 성능 테스트
      • Checkpoint 기능 관련 안내
      • 인터렉티브 작업 제출 예제
      • git 사용 방법 안내
      • PYTHON 2.7 EOL(End of Life) 안내
      • Conda 의 활용 소개
      • CPU 관련 오류 사항 ( illegal instruction )
      • vasp.5.4.4.18Apr17 Version Bug 이슈
      • 컴파일러별 AVX-512 옵션 정리
      • Linux(Unix) 에서 Text 파일 내용에 ^M 이 붙어 있는 경우 해결 방법
      • vasp.5.4.1.24Jun15 Version Bug 이슈
      • 오픈 소스 빌드 시에 OpenMP 체크 오류 (Intel 컴파일러)
      • X86_64 어셈블리 프로그래밍 기초
    • 누리온
      • MVAPICH2/MVAPICH2-X 성능 비교(VASP)
      • WRF
        • WRF 멀티노드 활용(SKL)
        • WRF 멀티노드 활용(KNL)
      • VASP
        • VASP 멀티노드 활용(SKL)
        • VASP 멀티노드 활용(KNL)
      • LAMMPS
        • LAMMPS 멀티노드 활용(SKL)
        • LAMMPS 멀티노드 활용(KNL)
      • Gromacs
        • Gromacs 멀티노드 활용 (SKL)
        • Gromacs 멀티노드 활용 (KNL)
      • QE
        • QE 멀티노드 활용(SKL)
        • QE 멀티노드 활용(KNL)
    • 뉴론
      • SSH Port Forwarding 을 통한 Jupyter 작업 실행
      • AMD 노드 활용
      • LAMMPS 멀티노드 활용
      • Gromacs 멀티노드 활용
      • OpenMPI 3.1.X 이슈 사항
      • MPI 환경설정 및 작업 제출 방법(2021.03)
  • 3️⃣동영상 지침서
    • 공통
      • 파일 전송 (FTP) 사용법
    • 누리온
      • 작업 제출 방법
      • 작업 스크립트 작성법
      • 슈퍼컴퓨터 모듈 사용법
      • 슈퍼컴퓨터 접속 방법 [Windows 사용자]
      • 슈퍼컴퓨터 접속 방법 [Mac 사용자]
    • 뉴론
      • 인터렉티브 작업 방법
      • Slurm 작업 제출 방법
      • conda 설정방법
      • 작업 스크립트 작성 방법
  • 4️⃣기타
    • 누리온
      • FAQ (2025.03)
      • 사용자 지침서 (2021.05)
      • 데스크톱 가상화(VDI)
      • TSMSF 사용자 지침서
      • i-PI 사용법 (LAMMPS)
      • 딥러닝 프레임워크 병렬화 사용법
      • Q-CHEM v5.2 사용자 지침서
      • ABAQUS 사용자 지침서(2020.12)
      • OpenFOAM 사용자 지침서
      • 가우시안16(Gaussian16) S/W 사용 안내 (2019.03)
      • ANSYS FLUENT 사용자 지침서(2020.03)
      • ANSYS CFX 사용자 지침서(2020.02)
      • NASTRAN 사용자 지침서(2020.02)
      • LS-DYNA 사용자 지침서(2020.02)
      • 가우시안16(Gaussian16) LINDA S/W 사용 안내 (2019.08)
    • 뉴론
      • 공유 노드 정책 변경에 따른 메모리 할당량 설정 안내
      • SLURM 스케줄러 Fairshare 스케줄링 정책
      • FAQ (2025.01)
      • OpenFOAM 사용자 지침서
      • Jupyter 사용자 지침서
      • 딥러닝 프레임워크 병렬화 사용법
      • Keras 기반 Multi GPU 사용 방법 (2020.10)
      • 가우시안16(Gaussian16) GPU S/W 사용 안내 (2019.08)
      • slurm 스케쥴러 기본 사용법 (2021.04)
      • 뉴론 시스템 개요(2021.04)
  • External Link
    • Nurion Guide(Eng)
    • Neuron Guide(Eng)
Powered by GitBook
On this page
  • 가. oneAPI Base ToolKit - 특징 및 장점
  • 1. oneAPI - Base Toolkit
  • 2. 주요사항
  • 나. oneAPI HPC ToolKit - 특징 및 장점
  • 1. oneAPI - HPC Toolkit
  • 2. 주요사항
  • 다. oneAPI: STREAM 벤치마크
  • 라. oneMKL: SGEMM 벤치마크
  1. 슈퍼컴퓨터 활용 팁
  2. 공통

oneAPI 소개

슈퍼컴퓨팅인프라센터 2021. 11. 3. 10:34

Previous공통NextAMD Instinct MI100 GPU 성능 테스트

Last updated 1 year ago

가. oneAPI Base ToolKit - 특징 및 장점

1. oneAPI - Base Toolkit

oneAPI와 인텔 oneAPI 툴킷은 함께 생산적이고 성능 기준에 맞는 이기종 프로그래밍을 개발자들에게 제공합니다.

  • 하드웨어의 가치를 모두 실현

최신 하드웨어의 모든 최첨단 기능을 도입하고 이용합니다. 예를 들어, AI 가속을 위한 인텔 딥러닝 부스트를 포함해 인텔 어드밴스드 익스텐션 512(인텔 AVX-512)를 지원하는 3세대 인텔 제온 스케일러블 프로세서를 최대한 활용할 수 있습니다. 또한 인텔 CPU, GPU, FPGA에서 성능을 극대화하여 가속 컴퓨팅을 충분히 활용할 수 있습니다.

  • 성능 기준에 맞는 코드를 빠르고 자신감 있게 개발 가능

아키텍처 간 라이브러리와 고급 도구 세트 전체를 사용하여 빠르고 효율적으로 개발할 수 있으며 CUDA 코드를 DPC++로 마이그레이션하는 등 레거시 코드와 쉽게 통합할 수 있습니다.

  • 미래에 대비하는 프로그래밍 모델로 선택의 자유 제공

간편한 아키텍처 리타깃팅을 위해 단일 벤더/독점 종속에 대한 개방형 대안을 확보할 수 있습니다.

2. 주요사항

  • 인텔 다이렉트 프로그래밍용 oneAPI DPC++/C++ 컴파일러

  • API 기반 프로그램의 라이브러리

  • 고급 분석 및 디버그 도구

인텔 oneAPI DPC++/C++ 컴파일러, 인텔 DPC++ 호환성 툴, 인텔 oneAPI DPC++ 라이브러리, 인텔 oneAPI 스레딩 빌딩 블록, 인텔 oneAPI 매스 커널 라이브러리, 인텔 oneAPI 데이터 애널리틱스 라이브러리, oneAPI 비디오 프로세싱 라이브러리, 인텔 어드바이저, 인텔 파이썬용 디스트리뷰션, 인텔 통합 퍼포먼스 프리미티브, 인텔 VTune™ 프로파일러, 인텔 GDB용 디스트리뷰션, 인텔 oneAPI 베이스 툴킷용 FPGA 애드온(옵션), 인텔 oneAPI 딥 뉴럴 네트워크 라이브러리, 인텔 oneAPI 공동 통신 라이브러리

나. oneAPI HPC ToolKit - 특징 및 장점

1. oneAPI - HPC Toolkit

인텔 oneAPI 베이스 및 HPC 툴킷은 고성능 컴퓨팅(HPC) 플랫폼에서 최신 인텔®프로세서의 성능을 최대한 활용한 현대식 코드를 빠르고 간편하게 빌드할 수 있는 광범위한 개발 도구 세트입니다.

  • 빠른 병렬 코드를 작성 업계 최고의 컴파일러, 성능 라이브러리, 성능 프로파일러, 코드 및 클러스터 분석 도구를 사용하여 현행 및 향후 인텔 플랫폼에서 확장 가능한 애플리케이션 성능을 강화할 수 있습니다.

  • 코드를 더 빠르게 빌드 빠르고 확장 가능하고 신뢰할 수 있는 병렬 코드의 작성 절차를 간소화 할 수 있습니다.

  • 우선 지원을 제공 인텔 엔지니어와 직접 연결하여 기술 문제에 대한 비공개 답변을 신속하게 받을 수 있습니다.

2. 주요사항

  • 단일 노드 또는 멀티 노드 선택 인텔 oneAPI HPC 툴킷은 공유 메모리 시스템을 구동하든, 분산 메모리 시스템을 구동하든, 아키텍처 간에 공략하는 데 필요한 모든 도구를 제공합니다. 각기 다른 지원이 필요한 워크스테이션부터 멀티 노드 클러스터까지 다양한 타겟 플랫폼에서 개발 및 배포가 가능합니다.

  • 아키텍처 간 고성능 컴퓨팅을 위한 강력한 도구 인텔 oneAPI DPC++/C++ 컴파일러, 인텔 C++ 컴파일러 클래식, XPU 개발을 위한 인텔 포트란 컴파일러(베타), 인텔 포트란 컴파일러 클래식, 인텔 클러스터 체커, 인텔 인스펙터, 인텔 MPI 라이브러리, 인텔 트레이스 애널라이저 앤 컬렉터, 인텔 oneAPI DPC++ 라이브러리, 인텔 oneAPI 스레딩 빌딩 블록, 인텔 oneAPI 매스 커널 라이브러리, 인텔 oneAPI 데이터 애널리틱스 라이브러리, 인텔 oneAPI 비디오 프로세싱 라이브러리, 인텔 어드바이저, 인텔 파이썬용 디스트리뷰션, 인텔 DPC++ 호환성 툴, 인텔 통합 퍼포먼스 프리미티브, 인텔 VTune™ 프로파일러, 인텔 GDB 디스트리뷰션, 인텔 FPGA oneAPI 베이스 툴킷용 애드온(옵션l)

다. oneAPI: STREAM 벤치마크

  • Triad 커널은 1차원 벡터에 대한 계산과 관련된 메모리 대역폭을 측정합니다 : a=b+ γc

  • Intel CPU 테스트 (Xeon Gold 6230/cas_v100_2): OpenMP에서 최고 성능을 보여줍니다.

    • 이론상 대역폭 : 281 GB/s (https://en.wikichip.org/wiki/intel/xeon_gold/6230)

    • OpenMP_18: intel/18.0.2 (icc), OpenMP_c: oneAPI-2021.3 (icc), OpenMP_x (icx), OpenCL (icx), SYCL (dpcpp)

    • Clang 기반 icx는 기존 icc보다 10% 낮은 대역폭을 제공

    • OpenCL 런타임은 OpenMP에서 낮은 성능을 제공

  • NVIDIA GPU 테스트 : 모든 프로그래밍 모델 간의 일관된 성능:

    • 이론상 대역폭: 288 GB/s (K40), 900 GB/s (V100)

    • OpenCL: oneAPI-2021.3 (icx), SYCL (intel-llvm), CUDA: cuda/10.1 (nvcc)

라. oneMKL: SGEMM 벤치마크

  • 단일 정밀도 BLAS3 행렬 곱셈:

    • 2 x Xeon Gold 6230의 이론상 성능 : 5.3 TFlops

    • 100번의 cblas_sgemm() 호출에 대한 평균 결과

  • 2018.2 vs openAPI 2021.3

    • N=M=K=4000의 경우 : 2021.3 MKL은 2018.2보다 15% 빠릅니다.

    • N=M=K=8000의 경우 : OpenMP(icc/icx)와 SYCL(dpcpp) 간의 일관된 성능: ~ 3.5GFlops(65%)

  • 출처 : https://www.intel.com/content/www/us/en/developer/tools/oneapi/base-toolkit.html#gs.ekh8n6 https://www.intel.com/content/www/us/en/developer/tools/oneapi/hpc-toolkit.html#gs.ekh9l4

2️⃣