KGGen: Extracting Knowledge Graphs from Plain Text with Language Models

Paper

KGGen: Extracting Knowledge Graphs from Plain Text with Language Models

Joan Cabezas

2026.01.17

·Arxiv·by 이호민

#Knowledge Graph#Language Models#Information Extraction#Entity Resolution#RAG

핵심 포인트

1KGGen은 LLM과 새로운 엔티티 및 관계 해상도 (entity and relation resolution) 알고리즘을 활용하여 일반 텍스트에서 고품질의 밀도 높은 Knowledge Graph (KG)를 추출하는 새로운 방법론을 제시합니다.
2본 연구는 KG 추출 성능을 측정하는 최초의 벤치마크인 MINE (Measure of Information in Nodes and Edges)을 도입했으며, KGGen은 기존 방법론에 비해 뛰어난 정보 유지율과 확장성을 보였습니다.
3KGGen은 엔티티와 관계를 효과적으로 군집화하고 중복을 제거함으로써 KG의 희소성 (sparsity) 문제를 크게 줄이며, 대규모 텍스트 코퍼스에서도 관계 유형의 재사용성 (reusability)을 높여 효율성을 입증했습니다.

KGGen: Extracting Knowledge Graphs from Plain Text with Language Models

Paper

KGGen: Extracting Knowledge Graphs from Plain Text with Language Models

Joan Cabezas

2026.01.17

·Arxiv·by 이호민

#Knowledge Graph#Language Models#Information Extraction#Entity Resolution#RAG

핵심 포인트

1KGGen은 LLM과 새로운 엔티티 및 관계 해상도 (entity and relation resolution) 알고리즘을 활용하여 일반 텍스트에서 고품질의 밀도 높은 Knowledge Graph (KG)를 추출하는 새로운 방법론을 제시합니다.
2본 연구는 KG 추출 성능을 측정하는 최초의 벤치마크인 MINE (Measure of Information in Nodes and Edges)을 도입했으며, KGGen은 기존 방법론에 비해 뛰어난 정보 유지율과 확장성을 보였습니다.
3KGGen은 엔티티와 관계를 효과적으로 군집화하고 중복을 제거함으로써 KG의 희소성 (sparsity) 문제를 크게 줄이며, 대규모 텍스트 코퍼스에서도 관계 유형의 재사용성 (reusability)을 높여 효율성을 입증했습니다.