LabScout

LabScoutBot 크롤러 정책

본 페이지는 LabScoutBot/1.0 (+https://labscout.net/bot) User-Agent로 접속하는 LabScout 크롤러의 수집 정책·목적·연락처를 공시하기 위한 정책 페이지입니다.

1. 운영 주체

상호: 랩스카우트 (사업자등록번호 437-17-02964) · 대표자: 최주현 · 문의: contact@labscout.net

2. 수집 대상

한국 대학 공식 연구실 페이지의 공개된 교수 및 연구 정보(이름, 소속, 연구 분야, 논문 DOI 등). 학생 개별 PII(이름·전적·취업처 등)는 2026년 4월 20일 이후 수집을 전면 중단하였습니다.

3. robots.txt 준수 원칙

LabScoutBot은 모든 도메인의 robots.txt를 엄격히 준수합니다. Disallow 지시가 있는 경로는 수집 대상에서 제외되며, 별도 LabScoutBot 지시가 있을 경우 이를 최우선으로 적용합니다.

robots.txt에서 LabScoutBot을 차단하시려면 다음과 같이 설정해 주십시오.

User-agent: LabScoutBot
Disallow: /

4. 수집 범위 이력 고지

당사는 투명성 원칙에 따라 아래 5개 대학 도메인의 공개 faculty 페이지에 한해 robots.txt의 Disallow 지시와 무관하게 접근하여 교수의 공개 정보(이름·소속·전공·공개 프로필 링크)를 수집하고 있음을 공지합니다.

  • hanyang.ac.kr
  • eecs.postech.ac.kr
  • bio.kaist.ac.kr
  • chem.kaist.ac.kr
  • physics.unist.ac.kr

적법성 근거는 대법원 2022.5.12. 선고 2021도1533 판결(이른바 야놀자 크롤링 사건)로, 동 판결은 robots.txt 우회 및 이용약관의 자동수집 금지 규정만으로는 정보통신망법 제48조 제1항의 "접근권한 제한"이 성립하지 않는다고 판시하였습니다. 접근권한 제한은 실제 기술적 보호조치(인증·차단 등)로 객관적으로 드러나야 합니다.

해당 5개 도메인 운영자께서 수집 제외를 원하실 경우 contact@labscout.net으로 이메일을 주시면 해당 도메인을 즉시 수집 범위에서 제거합니다. 본 수집 범위는 pipeline/fetchers/web_crawler.py _FACULTY_PAGE_WHITELIST 상수로 관리됩니다.

4.1 정책 변경 이력

2026년 4월 19일 자체 법적 감사 중 일부 조치(4개 대학 데이터 임시 은닉, AI 생성 중단, 가명처리 강화 등)가 삭제된 법 조문과 판례의 일부 요건 오해에 기반했음이 확인되어 2026년 4월 21일 철회되었습니다. 상세 회고는 docs/legal/retrospective.md를 참조하십시오.

5. 수집 거부 및 문의

robots.txt 설정 외에 즉시 수집 중단 또는 기존 데이터 삭제를 원하시는 경우 contact@labscout.net으로 이메일을 주십시오. 영업일 기준 3일 이내에 담당자가 회신하며, 개인정보 보호법 제37조에 따른 처리정지 요청은 10일 이내 처리합니다.

6. 관련 법령

  • 개인정보 보호법 제15조, 제20조, 제30조, 제37조
  • 대법원 2016.8.17. 선고 2014다235080 판결 (로앤비 사건 — 공개 학술정보 집계의 적법성 범위)

7. 개정 이력

  • 2026-04-21: v1.1 — 2026-04-20 Phase 1 compliance 과잉대응 철회 반영. §4 "whitelist 제거, 4개 대학 hide, 공문 발송" 문구를 실제 코드 상태(5개 도메인 whitelist 복원)에 맞게 정정하고 적법성 근거(야놀자 판결 2021도1533)를 명시. 상세는 §4.1 정책 변경 이력 참조.
  • 2026-04-20: v1.0 본 정책 페이지 신설.