Konferenzbeitrag

The KiezDeutsch Korpus (KiDKo) Release 1.0

This paper presents the first release of the KiezDeutsch Korpus (KiDKo), a new language resource with multiparty spoken dialogues of Kiezdeutsch, a newly emerging language variety spoken by adolescents from multi-ethnic urban areas in Germany. The first release of the corpus includes the transcriptions of the data as well as a normalisation layer and part-of-speech annotations. In the paper, we describe the main features of the new resource and then focus on automatic POS tagging of informal spoken language. Our tagger achieves an accuracy of nearly 97% on KiDKo. While we did not succeed in further improving the tagger using ensemble tagging, we present our approach to using the tagger ensembles for identifying error patterns in the automatically tagged data.

The KiezDeutsch Korpus (KiDKo) Release 1.0

Urheber*in: Rehbein, Ines; Schalowski, Sören; Wiese, Heike

Namensnennung - Nicht kommerziell 4.0 International

0
/
0

Sprache
Englisch

Thema
Gesprochene Sprache
Stadtmundart
Jugendsprache
Multikulturelle Gesellschaft
Korpus <Linguistik>
Sprache

Ereignis
Geistige Schöpfung
(wer)
Rehbein, Ines
Schalowski, Sören
Wiese, Heike
Ereignis
Veröffentlichung
(wer)
Paris : European Language Resources Association
(wann)
2016-11-21

URN
urn:nbn:de:bsz:mh39-55999
Letzte Aktualisierung
06.03.2025, 09:00 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Konferenzbeitrag

Beteiligte

  • Rehbein, Ines
  • Schalowski, Sören
  • Wiese, Heike
  • Paris : European Language Resources Association

Entstanden

  • 2016-11-21

Ähnliche Objekte (12)