Dual Context-Conditioned Open-Vocabulary Semantic Segmentation in Remote Sensing
본 연구는 원격 감지 이미지의 미학습 카테고리에 대한 픽셀 수준 레이블 할당을 목표로 하는 개방형 어휘 의미 분할을 제안합니다. 제안된 방법은 CLIP 이미지 인코더의 주의 계층에 영역 간 맥락 통합과 전역 맥락 통합으로 구성된 이중 맥락 조건을 주파수 인식 게이팅 메커니즘을 통해 통합하여 세부 사항과 장면 수준 구조의 균형을 맞춥니다. 17개 벤치마크 데이터셋에서의 광범위한 실험 결과, 제안된 방법이 원격 감지 분야의 훈련 불필요 개방형 어휘 의미 분할에서 최첨단 성능을 달성합니다.