Study of New Entity Discovery and Iterative Entity Linking

Minho Lee,Sangha Nam, Donghwan Kim

semanticscholar(2019)

引用 0|浏览0
暂无评分
摘要
지식베이스란 현실에 존재하는 개체와 개체 간의 관계를 모 아놓은저장소이다.지식베이스내의개체는고유한 URI(통합 자원 식별자, Uniform Resource Identifier)를 가지고 있어, 서 로다른개체는다른 URI를가진다.개체연결은자연어텍스트 내에서 개체를 나타내는 문자열을 대상으로 해당 개체가 지식 베이스 내의 어떤 URI에 해당하는지 연결하는 과제로, 관계 추출, 질의 응답 등 지식베이스 관련 과제의 기반이 된다. 개 체 연결은 지식베이스 내의 URI만을 대상으로 하기 때문에, 지식베이스에 저장된 URI의 개수가 많을수록 더 많은 종류의 개체를 지식베이스에 연결할 수 있다. 개체 연결에서 기존의 많은 연구는 개체 연결을 더 정확하게 하거나, 개체가 지식베 이스에 존재하는지의 여부를 판단하거나, 개체 연결에 실패한 개체들을 묶어서 분류하는 작업 등을 수행하였다. 기존 연구 에서는 지식베이스 내의 연결에 실패한 개체를 NIL 개체라고 칭하고,이중실제로지식베이스에없는개체를 Dark entity라 고 칭하였다. 본 연구에서는 Dark entity를 발견하고 지식베이 스의 URI를 부여하는 과정을 개체 발견이라고 명명한다. 개체 발견을 위해 개체 연결에 실패한 개체들을 군집화하고, 군집 들을 등록이 가능한지 검증하고, 검증된 개체를 지식베이스에 등록하여새로운 URI를부여한다.또한,새로등록된 URI를실 제로 개체 연결 과정에서 연결할 수 있는지, 또한 새로 등록된 개체들이 기존의 지식베이스로 학습한 모델에 얼마나 영향을 미치는지에대한실험을진행하였다.본연구에서는이실험과 정을 ‘반복적 개체 연결’이라고 부르고, 이에 대한 방법과 실험 및 데이터 설계, 그리고 평가 방법을 제안한다. 본 논문에서 기여하는 바는 다음과 같다. • 개체 발견을 통해 지식베이스를 확장하는 방법을 제시하였 다. • 반복적 개체 연결에 대한 실험 방법을 제시하고, 데이터를 만드는 법을 제시하였다.
更多
查看译文
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要