Konferenzbeitrag

Building and Annotating a Corpus of German-Language Newsgroups

Usenet is a large online resource containing user-generated messages (news articles) organised in discussion groups (newsgroups) which deal with a wide variety of different topics. We describe the download, conversion, and annotation of a comprehensive German news corpus for integration in DeReKo, the German Reference Corpus hosted at the Institut für Deutsche Sprache in Mannheim.

Building and Annotating a Corpus of German-Language Newsgroups

Urheber*in: Schröck, Jasmin; Lüngen, Harald

Urheberrechtsschutz

0
/
0

Sprache
Englisch

Thema
Korpus <Linguistik>
Annotation
Linguistik

Ereignis
Geistige Schöpfung
(wer)
Schröck, Jasmin
Lüngen, Harald
Ereignis
Veröffentlichung
(wer)
German Society for Computational Linguistics & Language Technology (GSCL)
(wann)
2015-11-12

URN
urn:nbn:de:bsz:mh39-43640
Letzte Aktualisierung
06.03.2025, 09:00 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Konferenzbeitrag

Beteiligte

  • Schröck, Jasmin
  • Lüngen, Harald
  • German Society for Computational Linguistics & Language Technology (GSCL)

Entstanden

  • 2015-11-12

Ähnliche Objekte (12)