Exploiting copy engines for intra-node MPI collective communication
본 논문은 멀티/메니코어 프로세서 환경에서 노드 내 MPI 집단 통신의 효율성을 높이기 위해 복사 엔진을 활용합니다. CPU 개입 없이 데이터를 이동하는 복사 엔진을 이용하여 브로드캐스트와 개더 연산 등의 차단형 집단 통신을 지원하는 CE-CPU 하이브리드 방식을 제안합니다. 실험 결과 제안된 방식은 마이크로벤치마크와 합성 애플리케이션의 전체 실행 시간을 각각 최대 72%, 57% 단축합니다.