Buchbeitrag
Integrating corpora of computer-mediated communication in CLARIN-D: Results from the curation project ChatCorpus2CLARIN
We introduce our pipeline to integrate CMC and SM corpora into the CLARIN-D corpus infrastructure. The pipeline was developed by transforming an existing CMC corpus, the Dortmund Chat Corpus, into a resource conforming to current technical and legal standards. We describe how the resource has been prepared and restructured in terms of TEI encoding, linguistic annotations, and anonymisation. The output is a CLARIN-conformant resource integrated in the CLARIN-D research infrastructure.
- Sprache
-
Englisch
- Thema
-
Deutsch
Chatten <Kommunikation>
Korpus <Linguistik>
Text Encoding Initiative (TEI)
Sprache
- Ereignis
-
Geistige Schöpfung
- (wer)
-
Lüngen, Harald
Beißwenger, Michael
Ehrhardt, Eric
Herold, Axel
Storrer, Angelika
- Ereignis
-
Veröffentlichung
- (wer)
-
Bochum : Sprachwissenschaftliches Institut, Ruhr-Universität Bochum
- (wann)
-
2016-11-16
- URN
-
urn:nbn:de:bsz:mh39-55743
- Letzte Aktualisierung
-
06.03.2025, 09:00 MEZ
Datenpartner
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.
Objekttyp
- Buchbeitrag
Beteiligte
- Lüngen, Harald
- Beißwenger, Michael
- Ehrhardt, Eric
- Herold, Axel
- Storrer, Angelika
- Bochum : Sprachwissenschaftliches Institut, Ruhr-Universität Bochum
Entstanden
- 2016-11-16