Preprint

The impact of lacking metadata and data truncation for the measurement of cultural and linguistic change using the Google Ngram datasets

As a result of legal restrictions the Google Ngram Corpora datasets are a) not accompanied by any metadata regarding the texts the corpora consist of and the data are b) truncated to prevent an indirect conclusion from the n-gram to the author of the text. Some of the consequences of this strategy are discussed in this article.

The impact of lacking metadata and data truncation for the measurement of cultural and linguistic change using the Google Ngram datasets

Urheber*in: Koplenig, Alexander

Urheberrechtsschutz

0
/
0

Sprache
Deutsch

Thema
Sprachwandel
Kulturwandel
Sprachstatistik
Korpus <Linguistik>
Datenstruktur
Metadaten
Linguistik

Ereignis
Geistige Schöpfung
(wer)
Koplenig, Alexander
Ereignis
Veröffentlichung
(wer)
Mannheim : Institut für Deutsche Sprache
(wann)
2014-10-17

URN
urn:nbn:de:bsz:mh39-31557
Letzte Aktualisierung
06.03.2025, 09:00 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Preprint

Beteiligte

  • Koplenig, Alexander
  • Mannheim : Institut für Deutsche Sprache

Entstanden

  • 2014-10-17

Ähnliche Objekte (12)