With no doubt the most popular accelerator for AI nowadays is GPU. However the world is heading towards the next step: AI-specific accelerators. There is much room to improve in terms of accelerator designs. For example, optimizing dataflow, utilizing sparse network structure, or processing-in-memory techniques.
To utilize multiple devices (i.e., GPUs) for high-speed DNN training, it's common to employ distributed learning. There are still many ways to improve current distributed learning methods: Devising a new communication algorithm, smartly pipelining the jobs, or changing the ways that devices synchronize.
Efficient deployment and training of deep neural networks require reducing both computation and memory overhead. Our research focuses on advanced quantization and compression techniques to accelerate both inference and training across a wide range of models, including large language models (LLMs), diffusion-based image generation, graph neural networks, and spiking neural networks.
We focus on optimizing and accelerating diverse programs and applications across emerging commercial hardwares including GPUs, CXL, and PIM (Processing-In-Memory). Our research spans multiple domains: communication libraries, graph processing algorithms, vector databases, and scientific applications.
출처: 연구실 홈페이지
현재 재학생
17명
최근 5년 졸업
0명
학위 과정 분포: 석박통합 13명, 박사 4명 (대학원 17명)
대학원 17명 · 포닥·학부연구생 1명 별도
본 페이지는 연구실 규모 파악을 위한 집계 통계(구성원 수, 진로 카테고리, 학위 과정 분포)만 제공하며, 개별 학생의 이름·전적·취업처 등은 표시하지 않습니다. 학위 과정 분포는 모든 재학생의 과정이 명확히 분류된 경우에만 표시되며 (분류 미상 학생이 1명이라도 있으면 미표시), k≥5 익명성 조건을 충족할 때만 공개됩니다 (PIPA §58-2·§28-2 + 대법원 2014다235080).
수집 중
수집 중
논문 데이터가 수집되면 연구 키워드가 자동 추출됩니다