Buchbeitrag

Transcription Bottleneck of Speech Corpus Exploitation

While written corpora can be exploited without any linguistic annotations, speech corpora need at least a basic transcription to be of any use for linguistic research. The basic annotation of speech data usually consists of time-aligned orthographic transcriptions. To answer phonetic or phonological research questions, phonetic transcriptions are needed as well. However, manual annotation is very time-consuming and requires considerable skill and near-native competence. Therefore it can take years of speech corpus compilation and annotation before any analyses can be carried out. In this paper, approaches that address the transcription bottleneck of speech corpus exploitation are presented and discussed, including crowdsourcing the orthographic transcription, automatic phonetic alignment, and query-driven annotation. Currently, query-driven annotation and automatic phonetic alignment are being combined and applied in two speech research projects at the Institut für Deutsche Sprache (IDS), whereas crowdsourcing the orthographic transcription still awaits implementation.

Urheber*in: Brinckmann, Caren

Urheberrechtsschutz

Sprache: Englisch

Thema: Gesprochene Sprache
Korpus <Linguistik>
Lautschrift
Annotation
Germanische Sprachen; Deutsch

Ereignis: Geistige Schöpfung

(wer): Brinckmann, Caren

Ereignis: Veröffentlichung

(wer): Bozen : Europäische Akademie

(wann): 2017-12-13

URN: urn:nbn:de:bsz:mh39-68329

Letzte Aktualisierung: 06.03.2025, 09:00 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Original beim Datenpartner anzeigen

Objekttyp

Buchbeitrag

Beteiligte

Brinckmann, Caren
Bozen : Europäische Akademie

Entstanden

2017-12-13

Ähnliche Objekte (12)

Transcription Bottleneck of Speech Corpus Exploitation

Buchbeitrag

Speech Act Verbs

Buchbeitrag

Using Automatic Speech Recognition in Spoken Corpus Curation

Buchbeitrag

Ein Standard in der Praxis: ISO 24624:2016. Transcription of spoken language

Buchbeitrag

Kempelen vs. Kratzenstein - Researchers on speech synthesis in times of change

Buchbeitrag

The Lexicalisation of Speech Act Evaluations in German, English and Dutch

Buchbeitrag

Antonymy relations: Typical and atypical cases from the domain of speech act verbs

Buchbeitrag

The Lexicographic exploitation of the Wendekorpus: Looking back at the themes and discourses of the Wende with the Wende-Wörterbuch

Buchbeitrag

Komplexere Gebrauchsmuster in Lernerwörterbüchern - Kritik und Perspektiven

Buchbeitrag

Compensating for compactness? Consumption and leisure travel of city dwellers vs. small town dwellers in Denmark

Buchbeitrag

Work-Family Balance

Buchbeitrag

Chronologie der literarischen Erscheinungen zu den Beiträgen

Transcription Bottleneck of Speech Corpus Exploitation

Buchbeitrag

Speech Act Verbs

Buchbeitrag

Using Automatic Speech Recognition in Spoken Corpus Curation

Buchbeitrag

Ein Standard in der Praxis: ISO 24624:2016. Transcription of spoken language

Buchbeitrag

Kempelen vs. Kratzenstein - Researchers on speech synthesis in times of change

Buchbeitrag

The Lexicalisation of Speech Act Evaluations in German, English and Dutch

Buchbeitrag

Antonymy relations: Typical and atypical cases from the domain of speech act verbs

Buchbeitrag

The Lexicographic exploitation of the Wendekorpus: Looking back at the themes and discourses of the Wende with the Wende-Wörterbuch

Buchbeitrag

Komplexere Gebrauchsmuster in Lernerwörterbüchern - Kritik und Perspektiven

Buchbeitrag

Compensating for compactness? Consumption and leisure travel of city dwellers vs. small town dwellers in Denmark

Buchbeitrag

Work-Family Balance

Buchbeitrag

Chronologie der literarischen Erscheinungen zu den Beiträgen

Transcription Bottleneck of Speech Corpus Exploitation

Buchbeitrag

Speech Act Verbs

Buchbeitrag

Using Automatic Speech Recognition in Spoken Corpus Curation

Buchbeitrag

Ein Standard in der Praxis: ISO 24624:2016. Transcription of spoken language

Buchbeitrag

Kempelen vs. Kratzenstein - Researchers on speech synthesis in times of change

Buchbeitrag

The Lexicalisation of Speech Act Evaluations in German, English and Dutch

Buchbeitrag

Antonymy relations: Typical and atypical cases from the domain of speech act verbs

Buchbeitrag

The Lexicographic exploitation of the Wendekorpus: Looking back at the themes and discourses of the Wende with the Wende-Wörterbuch

Buchbeitrag

Komplexere Gebrauchsmuster in Lernerwörterbüchern - Kritik und Perspektiven

Buchbeitrag

Compensating for compactness? Consumption and leisure travel of city dwellers vs. small town dwellers in Denmark

Buchbeitrag

Work-Family Balance

Buchbeitrag

Chronologie der literarischen Erscheinungen zu den Beiträgen

Informationen zur Registrierung von Kultur- und Wissenseinrichtungen finden Sie hier.

Felder mit * müssen ausgefüllt werden.

Benutzername*

Bitte geben Sie Ihren Benutzernamen ein

E-Mail*

Bitte geben Sie Ihre E-Mail ein

Bitte füllen Sie dieses Feld nicht aus

Vorname

Nachname

Passwort*

Bitte geben Sie Ihr Passwort ein

Passwort bestätigen*

Bitte geben Sie das gleiche Passwort ein

Ich habe die Nutzungsbedingungen und die Datenschutzerklärung zur Erhebung persönlicher Daten gelesen und stimme ihnen zu. *

Dieses Feld ist ein Pflichtfeld.

Ich möchte den Newsletter der Deutschen Digitalen Bibliothek abonnieren. Siehe Informationen zum Newsletter-Abonnement.

Benutzerkonto angelegt

Ihr „Meine DDB“-Konto wurde erfolgreich angelegt. Bevor Sie sich in Ihrem Konto anmelden können, müssen Sie auf den Bestätigungslink in der Nachricht klicken, die wir gerade an die von Ihnen angegebene E-Mail-Adresse geschickt haben

Transcription Bottleneck of Speech Corpus Exploitation

Download

Angaben zum Objekt

Klassifikation und Themen

Beteiligte, Orts- und Zeitangaben

Weitere Informationen

Datenpartner

Objekttyp

Beteiligte

Entstanden

Ähnliche Objekte (12)

Transcription Bottleneck of Speech Corpus Exploitation

Speech Act Verbs

Using Automatic Speech Recognition in Spoken Corpus Curation

Ein Standard in der Praxis: ISO 24624:2016. Transcription of spoken language

Kempelen vs. Kratzenstein - Researchers on speech synthesis in times of change

The Lexicalisation of Speech Act Evaluations in German, English and Dutch

Antonymy relations: Typical and atypical cases from the domain of speech act verbs

The Lexicographic exploitation of the Wendekorpus: Looking back at the themes and discourses of the Wende with the Wende-Wörterbuch

Komplexere Gebrauchsmuster in Lernerwörterbüchern - Kritik und Perspektiven

Compensating for compactness? Consumption and leisure travel of city dwellers vs. small town dwellers in Denmark

Work-Family Balance

Chronologie der literarischen Erscheinungen zu den Beiträgen

Transcription Bottleneck of Speech Corpus Exploitation

Speech Act Verbs

Using Automatic Speech Recognition in Spoken Corpus Curation

Ein Standard in der Praxis: ISO 24624:2016. Transcription of spoken language

Kempelen vs. Kratzenstein - Researchers on speech synthesis in times of change

The Lexicalisation of Speech Act Evaluations in German, English and Dutch

Antonymy relations: Typical and atypical cases from the domain of speech act verbs

The Lexicographic exploitation of the Wendekorpus: Looking back at the themes and discourses of the Wende with the Wende-Wörterbuch

Komplexere Gebrauchsmuster in Lernerwörterbüchern - Kritik und Perspektiven

Compensating for compactness? Consumption and leisure travel of city dwellers vs. small town dwellers in Denmark

Work-Family Balance

Chronologie der literarischen Erscheinungen zu den Beiträgen

Transcription Bottleneck of Speech Corpus Exploitation

Speech Act Verbs

Using Automatic Speech Recognition in Spoken Corpus Curation

Ein Standard in der Praxis: ISO 24624:2016. Transcription of spoken language

Kempelen vs. Kratzenstein - Researchers on speech synthesis in times of change

The Lexicalisation of Speech Act Evaluations in German, English and Dutch

Antonymy relations: Typical and atypical cases from the domain of speech act verbs

The Lexicographic exploitation of the Wendekorpus: Looking back at the themes and discourses of the Wende with the Wende-Wörterbuch

Komplexere Gebrauchsmuster in Lernerwörterbüchern - Kritik und Perspektiven

Compensating for compactness? Consumption and leisure travel of city dwellers vs. small town dwellers in Denmark

Work-Family Balance

Chronologie der literarischen Erscheinungen zu den Beiträgen

Verbundene Objekte

Passwort zurücksetzen