Buchbeitrag

Word sense alignment and disambiguation for historical encyclopedias

This paper will address the challenge of creating a knowledge graph from a corpus of historical encyclopedias with a special focus on word sense alignment (WSA) and disambiguation (WSD). More precisely, we examine WSA and WSD approaches based on article similarity to link messy historical data, utilizing Wikipedia as aground-truth component – as the lack of a critical overlap in content paired with the amount of variation between and within the encyclopedias does not allow for choosing a ”baseline” encyclopedia to align the others to. Additionally, we are comparing the disambiguation performance of conservative methods like the Lesk algorithm to more recent approaches, i.e. using language models to disambiguate senses.

Urheber*in: Hagen, Thora; Jannidis, Fotis; Witt, Andreas

Namensnennung 4.0 International

Sprache: Englisch

Thema: Semasiologie
Enzyklopädie
Wissensgraph
Korpus <Linguistik>
Wikipedia
Computerlinguistik
Sprache

Ereignis: Geistige Schöpfung

(wer): Hagen, Thora
Jannidis, Fotis
Witt, Andreas

Ereignis: Veröffentlichung

(wer): Gießen : Graphen & Netzwerke; AG des Verbandes Digital Humanities im deutschsprachigen Raum e.V.
Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

(wann): 2022-03-24

URN: urn:nbn:de:bsz:mh39-109834

Letzte Aktualisierung: 06.03.2025, 08:00 UTC

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Original beim Datenpartner anzeigen

Objekttyp

Buchbeitrag

Beteiligte

Hagen, Thora
Jannidis, Fotis
Witt, Andreas
Gießen : Graphen & Netzwerke; AG des Verbandes Digital Humanities im deutschsprachigen Raum e.V.
Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

Entstanden

2022-03-24

Ähnliche Objekte (12)

Buchbeitrag

SGML und Linguistik

Buchbeitrag

Multiple hierarchies: new aspects of an old solution. Re-published

Buchbeitrag

Linguistische Informationsmodellierung mit XML

Buchbeitrag

Leibniz-WissenschaftsCampus "Empirical Linguistics & Computational Language Modeling (LiMo)"

Buchbeitrag

DSSSL zur Verarbeitung linguistischer Korpora

Buchbeitrag

Texttechnologie an der Universität Bielefeld

Buchbeitrag

Maschinelle Übersetzung – Gegenwart und Perspektiven

Buchbeitrag

Grundlagen für den Computereinsatz in der Linguistik: Attribute, Werte, Unifikation

Buchbeitrag

Modeling and annotating complex data structures

Buchbeitrag

Lexikonexpansion: Vom XML-annotiertem Stammformenlexikon zum Vollformenlexikon

Buchbeitrag

Präsentation, Transformation und Analyse: Verarbeitung XML-basierter japanischer Dialoge

Buchbeitrag

Sprachverfall? Einleitung

Buchbeitrag

SGML und Linguistik

Buchbeitrag

Multiple hierarchies: new aspects of an old solution. Re-published

Buchbeitrag

Linguistische Informationsmodellierung mit XML

Buchbeitrag

Leibniz-WissenschaftsCampus "Empirical Linguistics & Computational Language Modeling (LiMo)"

Buchbeitrag

DSSSL zur Verarbeitung linguistischer Korpora

Buchbeitrag

Texttechnologie an der Universität Bielefeld

Buchbeitrag

Maschinelle Übersetzung – Gegenwart und Perspektiven

Buchbeitrag

Grundlagen für den Computereinsatz in der Linguistik: Attribute, Werte, Unifikation

Buchbeitrag

Modeling and annotating complex data structures

Buchbeitrag

Lexikonexpansion: Vom XML-annotiertem Stammformenlexikon zum Vollformenlexikon

Buchbeitrag

Präsentation, Transformation und Analyse: Verarbeitung XML-basierter japanischer Dialoge

Buchbeitrag

Sprachverfall? Einleitung

Buchbeitrag

SGML und Linguistik

Buchbeitrag

Multiple hierarchies: new aspects of an old solution. Re-published

Buchbeitrag

Linguistische Informationsmodellierung mit XML

Buchbeitrag

Leibniz-WissenschaftsCampus "Empirical Linguistics & Computational Language Modeling (LiMo)"

Buchbeitrag

DSSSL zur Verarbeitung linguistischer Korpora

Buchbeitrag

Texttechnologie an der Universität Bielefeld

Buchbeitrag

Maschinelle Übersetzung – Gegenwart und Perspektiven

Buchbeitrag

Grundlagen für den Computereinsatz in der Linguistik: Attribute, Werte, Unifikation

Buchbeitrag

Modeling and annotating complex data structures

Buchbeitrag

Lexikonexpansion: Vom XML-annotiertem Stammformenlexikon zum Vollformenlexikon

Buchbeitrag

Präsentation, Transformation und Analyse: Verarbeitung XML-basierter japanischer Dialoge

Buchbeitrag

Sprachverfall? Einleitung

Informationen zur Registrierung von Kultur- und Wissenseinrichtungen finden Sie hier.

Felder mit * müssen ausgefüllt werden.

Benutzername*

Bitte geben Sie Ihren Benutzernamen ein

E-Mail*

Bitte geben Sie Ihre E-Mail ein

Bitte füllen Sie dieses Feld nicht aus

Vorname

Nachname

Passwort*

Bitte geben Sie Ihr Passwort ein

Passwort bestätigen*

Bitte geben Sie das gleiche Passwort ein

Ich habe die Datenschutzerklärung zur Erhebung persönlicher Daten gelesen und stimme ihr zu.*

Dieses Feld ist ein Pflichtfeld.

Ich möchte den Newsletter der Deutschen Digitalen Bibliothek abonnieren. Siehe Informationen zum Newsletter-Abonnement.

Benutzerkonto angelegt

Ihr „Meine DDB“-Konto wurde erfolgreich angelegt. Bevor Sie sich in Ihrem Konto anmelden können, müssen Sie auf den Bestätigungslink in der Nachricht klicken, die wir gerade an die von Ihnen angegebene E-Mail-Adresse geschickt haben

Word sense alignment and disambiguation for historical encyclopedias

Download

Objekt anzeigen

Klassifikation und Themen

Beteiligte, Orts- und Zeitangaben

Weitere Informationen

Datenpartner

Objekttyp

Beteiligte

Entstanden

Ähnliche Objekte (12)

SGML und Linguistik

Multiple hierarchies: new aspects of an old solution. Re-published

Linguistische Informationsmodellierung mit XML

Leibniz-WissenschaftsCampus "Empirical Linguistics & Computational Language Modeling (LiMo)"

DSSSL zur Verarbeitung linguistischer Korpora

Texttechnologie an der Universität Bielefeld

Maschinelle Übersetzung – Gegenwart und Perspektiven

Grundlagen für den Computereinsatz in der Linguistik: Attribute, Werte, Unifikation

Modeling and annotating complex data structures

Lexikonexpansion: Vom XML-annotiertem Stammformenlexikon zum Vollformenlexikon

Präsentation, Transformation und Analyse: Verarbeitung XML-basierter japanischer Dialoge

Sprachverfall? Einleitung

SGML und Linguistik

Multiple hierarchies: new aspects of an old solution. Re-published

Linguistische Informationsmodellierung mit XML

Leibniz-WissenschaftsCampus "Empirical Linguistics & Computational Language Modeling (LiMo)"

DSSSL zur Verarbeitung linguistischer Korpora

Texttechnologie an der Universität Bielefeld

Maschinelle Übersetzung – Gegenwart und Perspektiven

Grundlagen für den Computereinsatz in der Linguistik: Attribute, Werte, Unifikation

Modeling and annotating complex data structures

Lexikonexpansion: Vom XML-annotiertem Stammformenlexikon zum Vollformenlexikon

Präsentation, Transformation und Analyse: Verarbeitung XML-basierter japanischer Dialoge

Sprachverfall? Einleitung

SGML und Linguistik

Multiple hierarchies: new aspects of an old solution. Re-published

Linguistische Informationsmodellierung mit XML

Leibniz-WissenschaftsCampus "Empirical Linguistics & Computational Language Modeling (LiMo)"

DSSSL zur Verarbeitung linguistischer Korpora

Texttechnologie an der Universität Bielefeld

Maschinelle Übersetzung – Gegenwart und Perspektiven

Grundlagen für den Computereinsatz in der Linguistik: Attribute, Werte, Unifikation

Modeling and annotating complex data structures

Lexikonexpansion: Vom XML-annotiertem Stammformenlexikon zum Vollformenlexikon

Präsentation, Transformation und Analyse: Verarbeitung XML-basierter japanischer Dialoge

Sprachverfall? Einleitung

Verbundene Objekte

Passwort zurücksetzen