Buchbeitrag

Corpus REDEWIEDERGABE

This article presents the corpus REDEWIEDERGABE, a German-language historical corpus with detailed annotations for speech, thought and writing representation (ST&WR). With approximately 490,000 tokens, it is the largest resource of its kind. It can be used to answer literary and linguistic research questions and serve as training material for machine learning. This paper describes the composition of the corpus and the annotation structure, discusses some methodological decisions and gives basic statistics about the forms of ST&WR found in this corpus.

Corpus REDEWIEDERGABE

Urheber*in: Brunner, Annelen; Engelberg, Stefan; Jannidis, Fotis; Tu, Ngoc Duyen Tanja; Weimer, Lukas

Namensnennung - Nicht kommerziell 4.0 International

0
/
0

Sprache
Englisch

Thema
Annotation
Korpus <Linguistik>
Maschinelles Lernen
Redeerwähnung
Methodik
Sprache

Ereignis
Geistige Schöpfung
(wer)
Brunner, Annelen
Engelberg, Stefan
Jannidis, Fotis
Tu, Ngoc Duyen Tanja
Weimer, Lukas
Ereignis
Veröffentlichung
(wer)
Paris : European Language Resources Association
(wann)
2020-06-15

URN
urn:nbn:de:bsz:mh39-98963
Letzte Aktualisierung
06.03.2025, 09:00 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Buchbeitrag

Beteiligte

  • Brunner, Annelen
  • Engelberg, Stefan
  • Jannidis, Fotis
  • Tu, Ngoc Duyen Tanja
  • Weimer, Lukas
  • Paris : European Language Resources Association

Entstanden

  • 2020-06-15

Ähnliche Objekte (12)