FantasyCoref:Coreference Resolution on Fantasy Literature Through Omniscient Writer’s Point of View

2021. 12. 22. 19:23프로젝트

‘FantasyCoref(2021 CRAC, EMNLP)’ 프로젝트란?
보통 Coreference Resolution의 데이터셋, 가이드라인 등은 non-fiction 위주이다. 그런데 소설, 특히 비현실적인 이벤트들이 일어나는 판타지 소설에서는 기존 coreference resolution guideline으로 해결하기 어려운 문제들이 발생한다. 백설 공주를 예로 들어보자. 왕비가 마녀 분장을 하고 백설공주가 있는 난쟁이 집의 문을 두드린다. 백설공주는 문을 두드린 사람이 왕비인지 모르지만, 독자는 알고있다. 이 경우 마녀와 왕비를 하나의 엔티티로 연결해야할까? FantasyCoref 페이퍼에서는 판타지소설(주로 그림형제동화) coreference resolution dataset을 만들고, 기존 coreference guideline을 통해 해결하기 어려운 부분에 대한 새로운 guideline을 제시한다. 또한 새롭게 만든 dataset의 품질을 평가하기 위한 fine-tuning experiment를 진행했다. 데이터셋은 여기, 페이퍼는 여기에서 확인할 수 있다.

  1. data source, annotation process
  2. dataset statistics
  3. guidelines
  4. experiment
  5. conclusion
반응형