Artikel

Rescuing Legacy Data

This paper discusses issues that arise in the transformation of electronic language data from outdated to modern, sustainable formats. We first describe the problem and then present four different cases in which corpora of spoken language were converted from legacy formats to an XML-based representation. For each of the four cases, we describe the conversion workflow and discuss the difficulties that we had to overcome. Based on this experience, we formulate some more general observations about transforming legacy data and conclude with a set of best practice recommendations for a more sustainable handling of language corpora.

Rescuing Legacy Data

Urheber*in: Schmidt, Thomas; Bennöhr, Jasmine

Namensnennung - Nicht kommerziell 4.0 International

0
/
0

Sprache
Englisch

Thema
Gesprochene Sprache
Korpus <Linguistik>
Datenformat
Datenkonvertierung
Linguistik

Ereignis
Geistige Schöpfung
(wer)
Schmidt, Thomas
Bennöhr, Jasmine
(wann)
2008
Ereignis
Veröffentlichung
(wer)
Honolulu : University of Hawaii Press

URN
urn:nbn:de:bsz:mh39-23160
Letzte Aktualisierung
06.03.2025, 09:00 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Artikel

Beteiligte

  • Schmidt, Thomas
  • Bennöhr, Jasmine
  • Honolulu : University of Hawaii Press

Entstanden

  • 2008

Ähnliche Objekte (12)