Buchbeitrag

Word sense alignment and disambiguation for historical encyclopedias

This paper will address the challenge of creating a knowledge graph from a corpus of historical encyclopedias with a special focus on word sense alignment (WSA) and disambiguation (WSD). More precisely, we examine WSA and WSD approaches based on article similarity to link messy historical data, utilizing Wikipedia as aground-truth component – as the lack of a critical overlap in content paired with the amount of variation between and within the encyclopedias does not allow for choosing a ”baseline” encyclopedia to align the others to. Additionally, we are comparing the disambiguation performance of conservative methods like the Lesk algorithm to more recent approaches, i.e. using language models to disambiguate senses.

Word sense alignment and disambiguation for historical encyclopedias

Urheber*in: Hagen, Thora; Jannidis, Fotis; Witt, Andreas

Namensnennung 4.0 International

Sprache
Englisch

Thema
Semasiologie
Enzyklopädie
Wissensgraph
Korpus <Linguistik>
Wikipedia
Computerlinguistik
Sprache

Ereignis
Geistige Schöpfung
(wer)
Hagen, Thora
Jannidis, Fotis
Witt, Andreas
Ereignis
Veröffentlichung
(wer)
Gießen : Graphen & Netzwerke; AG des Verbandes Digital Humanities im deutschsprachigen Raum e.V.
Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)
(wann)
2022-03-24

URN
urn:nbn:de:bsz:mh39-109834
Letzte Aktualisierung
06.03.2025, 09:00 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Buchbeitrag

Beteiligte

  • Hagen, Thora
  • Jannidis, Fotis
  • Witt, Andreas
  • Gießen : Graphen & Netzwerke; AG des Verbandes Digital Humanities im deutschsprachigen Raum e.V.
  • Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

Entstanden

  • 2022-03-24

Ähnliche Objekte (12)