Relation Extraction for Diet, Non-Communicable Disease and Biomarker Associations (RECoDe): A CoDiet study
본 연구는 식이요법, 질병, 생물표지자 간의 관계 추출을 위해 5,000개 이상의 인간 주석 인스턴스로 구성된 RECoDe 데이터셋을 소개합니다. BERT 기반 모델과 대규모 언어모델(LLM)을 벤치마킹한 결과, gpt-oss-20B 모델이 다중 분류에서 64%, 이진 분류에서 92%의 F1 점수를 달성했습니다. 제안된 Co-CoS 프레임워크는 문장 수준의 관계 추출을 문서 수준 요약으로 통합하여 체계적 증거 합성의 유효성을 입증합니다.