Konferenzbeitrag
Building and Annotating a Corpus of German-Language Newsgroups
Usenet is a large online resource containing user-generated messages (news articles) organised in discussion groups (newsgroups) which deal with a wide variety of different topics. We describe the download, conversion, and annotation of a comprehensive German news corpus for integration in DeReKo, the German Reference Corpus hosted at the Institut für Deutsche Sprache in Mannheim.
- Sprache
-
Englisch
- Thema
-
Korpus <Linguistik>
Annotation
Linguistik
- Ereignis
-
Geistige Schöpfung
- (wer)
-
Schröck, Jasmin
Lüngen, Harald
- Ereignis
-
Veröffentlichung
- (wer)
-
German Society for Computational Linguistics & Language Technology (GSCL)
- (wann)
-
2015-11-12
- URN
-
urn:nbn:de:bsz:mh39-43640
- Letzte Aktualisierung
-
06.03.2025, 09:00 MEZ
Datenpartner
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.
Objekttyp
- Konferenzbeitrag
Beteiligte
- Schröck, Jasmin
- Lüngen, Harald
- German Society for Computational Linguistics & Language Technology (GSCL)
Entstanden
- 2015-11-12