Operating systems for heterogeneous many-core systems. Managing a large number of heterogeneous independent cores with the goal to provide maximal performance at a minimal energy consumption.
Virtualization techniques on many-core systems and clouds. Improving data center utilization through intelligent resource management, interference management, and dynamic relocation of applications.
Compilers and runtime-environments for next-generation many-core coarse-grained reconfigurable architectures. CGRAs combine the flexibility of software with the performance of parallel hardware.
Research on power management through cooperation between coarse-grained resource manager and application-specific runtime. Allows grouping of cores with similar load patterns for efficient DVFS settings.
Compiler-assisted generation of random test code for hardware verification. Enables hardware manufacturers to quickly and efficiently verify the functional correctness of CGRA hardware design.
출처: 연구실 홈페이지
현재 재학생
8명
최근 5년 졸업
0명
학위 과정 분포: 석사 2명, 박사 6명 (대학원 8명)
대학원 8명
본 페이지는 연구실 규모 파악을 위한 집계 통계(구성원 수, 진로 카테고리, 학위 과정 분포)만 제공하며, 개별 학생의 이름·전적·취업처 등은 표시하지 않습니다. 학위 과정 분포는 모든 재학생의 과정이 명확히 분류된 경우에만 표시되며 (분류 미상 학생이 1명이라도 있으면 미표시), k≥5 익명성 조건을 충족할 때만 공개됩니다 (PIPA §58-2·§28-2 + 대법원 2014다235080).
본 논문은 리소스 제약이 있는 임베디드 기기들에서 CNN 추론을 분산 실행하기 위한 ADaPS 프레임워크를 제시합니다. 분석 모델을 통해 4D 텐서의 높이와 너비 차원을 분할하고 레이어 융합 기회를 탐색하며, 알파-베타 가지치기와 동적 프로그래밍을 결합한 트리 기반 최적화 알고리즘으로 분할 공간을 효율적으로 탐색합니다. 평가 결과 ADaPS는 추론 지연시간을 평균 1.2배 개선하고 데이터 전송을 크게 감소시킵니다.
본 논문은 매개변수화 가능한 신경망 가속기의 하드웨어/소프트웨어 설정을 최적화하는 SENNA 프레임워크를 제시합니다. 다중목표 유전 알고리즘과 병렬 아일랜드 모델을 활용하여 전체 네트워크에 걸친 최적 구성을 탐색하며, 세 가지 아키텍처와 네 개의 신경망 평가에서 기존 방법 대비 최대 1.92배의 EDP 개선과 2.5~9.3배의 속도 향상을 달성합니다.
본 연구는 CPU와 GPU의 유휴 시간을 최소화하는 동적 워크로드 할당 기법을 통해 대규모 언어 모델의 처리량을 향상시킵니다. 디코더 기반 모델에 적용된 이 기법은 OPT-30B 모델에서 기존 방식 대비 최대 105% 처리량 증가를 달성합니다.