Buchbeitrag

Integrating corpora of computer-mediated communication in CLARIN-D: Results from the curation project ChatCorpus2CLARIN

We introduce our pipeline to integrate CMC and SM corpora into the CLARIN-D corpus infrastructure. The pipeline was developed by transforming an existing CMC corpus, the Dortmund Chat Corpus, into a resource conforming to current technical and legal standards. We describe how the resource has been prepared and restructured in terms of TEI encoding, linguistic annotations, and anonymisation. The output is a CLARIN-conformant resource integrated in the CLARIN-D research infrastructure.

Integrating corpora of computer-mediated communication in CLARIN-D: Results from the curation project ChatCorpus2CLARIN

Urheber*in: Lüngen, Harald; Beißwenger, Michael; Ehrhardt, Eric; Herold, Axel; Storrer, Angelika

Urheberrechtsschutz

0
/
0

Sprache
Englisch

Thema
Deutsch
Chatten <Kommunikation>
Korpus <Linguistik>
Text Encoding Initiative (TEI)
Sprache

Ereignis
Geistige Schöpfung
(wer)
Lüngen, Harald
Beißwenger, Michael
Ehrhardt, Eric
Herold, Axel
Storrer, Angelika
Ereignis
Veröffentlichung
(wer)
Bochum : Sprachwissenschaftliches Institut, Ruhr-Universität Bochum
(wann)
2016-11-16

URN
urn:nbn:de:bsz:mh39-55743
Letzte Aktualisierung
06.03.2025, 09:00 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Buchbeitrag

Beteiligte

  • Lüngen, Harald
  • Beißwenger, Michael
  • Ehrhardt, Eric
  • Herold, Axel
  • Storrer, Angelika
  • Bochum : Sprachwissenschaftliches Institut, Ruhr-Universität Bochum

Entstanden

  • 2016-11-16

Ähnliche Objekte (12)