Konferenzbeitrag

Detecting the boundaries of sentence-like units on spoken German

Automatic division of spoken language transcripts into sentence-like units is a challenging problem, caused by disfluencies, ungrammatical structures and the lack of punctuation. We present experiments on dividing up German spoken dialogues where we investigate the impact of task setup and data representation, encoding of context information as well as different model architectures for this task.

Sprache
Englisch

Thema
Deutsch
Gesprochene Sprache
Automatische Sprachanalyse
Segmentierung
Satz
Sprache

Ereignis
Geistige Schöpfung
(wer)
Ruppenhofer, Josef
Rehbein, Ines
Ereignis
Veröffentlichung
(wer)
München [u.a.] : German Society for Computational Linguistics & Language Technology und Friedrich-Alexander-Universität Erlangen-Nürnberg
(wann)
2019-10-15

URN
urn:nbn:de:bsz:mh39-93174
Letzte Aktualisierung
06.03.2025, 09:00 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Konferenzbeitrag

Beteiligte

  • Ruppenhofer, Josef
  • Rehbein, Ines
  • München [u.a.] : German Society for Computational Linguistics & Language Technology und Friedrich-Alexander-Universität Erlangen-Nürnberg

Entstanden

  • 2019-10-15

Ähnliche Objekte (12)