Konferenzbeitrag

The Vast and the Focused: On the need for domain-focused web corpora

As the Web ought to be considered as a series of sources rather than as a source in itself, a problem facing corpus construction resides in meta-information and categorization. In addition, we need focused data to shed light on particular subfields of the digital public sphere. Blogs are relevant to that end, especially if the resulting web texts can be extracted along with metadata and made available in coherent and clearly describable collections.

The Vast and the Focused: On the need for domain-focused web corpora

Urheber*in: Barbaresi, Adrien

Namensnennung 4.0 International

0
/
0

Sprache
Englisch

Thema
Korpus <Linguistik>
Sprache

Ereignis
Geistige Schöpfung
(wer)
Barbaresi, Adrien
Ereignis
Veröffentlichung
(wer)
Mannheim : Leibniz-Institut für Deutsche Sprache
(wann)
2019-07-04

URN
urn:nbn:de:bsz:mh39-90257
Letzte Aktualisierung
06.03.2025, 09:00 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Konferenzbeitrag

Beteiligte

  • Barbaresi, Adrien
  • Mannheim : Leibniz-Institut für Deutsche Sprache

Entstanden

  • 2019-07-04

Ähnliche Objekte (12)