Konferenzbeitrag
CMC Corpora in DeReKo
We introduce three types of corpora of computer-mediated communication that have recently been compiled at the Institute for the German Language or curated from an external project and included in DeReKo, the German Reference Corpus, namely Wikipedia (discussion) corpora, the Usenet news corpus, and the Dortmund Chat Corpus. The data and corpora have been converted to I5, the TEI customization to represent texts in DeReKo, and are researchable via the web-based IDS corpus research interfaces and in the case of Wikipedia and chat also downloadable from the IDS repository and download server, respectively.
- Sprache
-
Englisch
- Thema
-
Korpus <Linguistik>
Deutsch
Internet
Wikipedia
UseNet
Sprache
- Ereignis
-
Geistige Schöpfung
- (wer)
-
Lüngen, Harald
Kupietz, Marc
- Ereignis
-
Veröffentlichung
- (wer)
-
Mannheim : Institut für Deutsche Sprache
- (wann)
-
2017-07-05
- URN
-
urn:nbn:de:bsz:mh39-62592
- Letzte Aktualisierung
-
06.03.2025, 09:00 MEZ
Datenpartner
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.
Objekttyp
- Konferenzbeitrag
Beteiligte
- Lüngen, Harald
- Kupietz, Marc
- Mannheim : Institut für Deutsche Sprache
Entstanden
- 2017-07-05