한환수 연구실

성균관대학교 소프트웨어학과

수집 현황75%

오류 신고

한환수 연구실

성균관대학교 소프트웨어학과

수집 현황75%

오류 신고

4편최근 5년 논문

8명구성원

기본 정보

대학 웹사이트

한

한환수

Hwan-Su Han

성균관대학교 소프트웨어학과

딥러닝 컴파일러, 빅데이터 분석 시스템, 비휘발성 메모리를 위한 시스템SW

컴파일러 시스템 연구실

연구실 웹사이트정상 접속

hhan@skku.edu

연구 분야

대학 웹사이트

Compiler Optimization for Deep Learning Frameworks

compiler optimizationdeep learningframeworks

Optimization for Big Data Frameworks

optimizationbig dataframeworks

System Software for Emerging Non-Volatile Memory and Storage

system softwarenon-volatile memorystorage

진행 중 프로젝트

QoS Compiler for Multi-Tenant Deep Learning Applications

National Research Fund (NRF)2025.09-2028.08

Co-design of Peta-Scale Host-Storage for Large AI Applications

Samsung Electronics2022.05-2026.05

출처: 연구실 홈페이지

학생 구성

대학 웹사이트1주 전

현재 재학생

7명

최근 5년 졸업

0명

졸업생 진로 분포는 k≥5 조건을 충족하면 표시됩니다.

재학생 학위 과정 분포

대학원 7명 · 포닥·학부연구생 1명 별도

본 페이지는 연구실 규모 파악을 위한 집계 통계(구성원 수, 진로 카테고리, 학위 과정 분포)만 제공하며, 개별 학생의 이름·전적·취업처 등은 표시하지 않습니다. 학위 과정 분포는 모든 재학생의 과정이 명확히 분류된 경우에만 표시되며 (분류 미상 학생이 1명이라도 있으면 미표시), k≥5 익명성 조건을 충족할 때만 공개됩니다 (PIPA §58-2·§28-2 + 대법원 2014다235080).

최근 논문

OpenAlex3주 전

Compile-Time QoS Scheme for Deep Learning Inferences

Other

2025년 11월 12일인용 1

본 논문은 GPU, TPU, NPU 등 가속기에서 여러 딥러닝 서비스를 동시에 처리할 때 QoS 보장을 위해 컴파일 타임에 커널 슬라이싱을 통해 스케줄러 부담을 경감하는 QoSlicer 프레임워크를 제시합니다. 휴리스틱 탐색 알고리즘과 성능 추정 모델을 활용하여 최적의 슬라이싱 계획을 생성하며, 75개 워크로드 조합 실험에서 기존 기법 대비 평균 20.2% 처리량 향상을 달성합니다.

AI 생성원문 보기

GPU thread throttling for page-level thrashing reduction via static analysis

The Journal of SupercomputingJournal

2023년 12월 16일인용 1

원문 보기

Accelerating Deep Neural Networks on Mobile Multicore NPUs

Other

2023년 2월 17일인용 6

본 논문은 모바일 멀티코어 NPU에서 DNN 추론 성능을 최적화하는 기법을 제안합니다. 레이어를 여러 서브레이어로 분할하여 병렬 실행하고, 파이프라인 처리와 동기화 최적화를 통해 메모리 접근 병목을 완화합니다. 6개의 CNN으로 평가한 결과, 기존 방식 대비 23% 성능 향상과 단일코어 대비 2.1배 속도 향상을 달성했습니다.

AI 생성원문 보기

Libpubl

Other

2021년 7월 20일인용 1

본 논문은 비휘발성 메인 메모리(NVMM) 환경에서 메모리 매핑 IO의 쓰기 증폭 오버헤드를 줄이기 위해 사용자 레벨 라이브러리 파일 시스템 Libpubl을 제안합니다. 지속적 사용자 버퍼를 로그로 활용하여 원자적 업데이트를 보장하고 성능을 개선합니다. Fio 벤치마크에서 기존 NVM 파일 시스템 대비 50~120% 성능 향상을 달성합니다.

AI 생성원문 보기

Static code transformations for thread‐dense memory accesses in GPU computing

Concurrency and Computation Practice and ExperienceJournal

2019년 10월 18일인용 3

본 논문은 GPU의 공유 메모리에 데이터를 미리 로드하는 정적 코드 변환 기법을 제시합니다. 높은 스레드 밀도의 전역 메모리 접근 패턴을 분석하여 공유 메모리에 적재할 데이터를 선택하고, 소스-소스 컴파일러를 통해 GPU 커널 코드를 변환합니다. GTX980과 P100 GPU에서 각각 평균 1.26배, 1.62배의 성능 향상을 달성합니다.

AI 생성원문 보기

논문 트렌드

OpenAlex

⚠2022, 2024년 논문 데이터가 누락되어 추세가 부정확할 수 있습니다