Konferenzbeitrag
The Vast and the Focused: On the need for domain-focused web corpora
As the Web ought to be considered as a series of sources rather than as a source in itself, a problem facing corpus construction resides in meta-information and categorization. In addition, we need focused data to shed light on particular subfields of the digital public sphere. Blogs are relevant to that end, especially if the resulting web texts can be extracted along with metadata and made available in coherent and clearly describable collections.
- Sprache
-
Englisch
- Thema
-
Korpus <Linguistik>
Sprache
- Ereignis
-
Geistige Schöpfung
- (wer)
-
Barbaresi, Adrien
- Ereignis
-
Veröffentlichung
- (wer)
-
Mannheim : Leibniz-Institut für Deutsche Sprache
- (wann)
-
2019-07-04
- URN
-
urn:nbn:de:bsz:mh39-90257
- Letzte Aktualisierung
-
06.03.2025, 09:00 MEZ
Datenpartner
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.
Objekttyp
- Konferenzbeitrag
Beteiligte
- Barbaresi, Adrien
- Mannheim : Leibniz-Institut für Deutsche Sprache
Entstanden
- 2019-07-04