Konferenzbeitrag

A Functional Database Framework for Querying Very Large Multi-Layer Corpora

Linguistic query systems are special purpose IR applications. We present a novel state-of-the-art approach for the efficient exploitation of very large linguistic corpora, combining the advantages of relational database management systems (RDBMS) with the functional MapReduce programming model. Our implementation uses the German DEREKO reference corpus with multi-layer linguistic annotations and several types of text-specific metadata, but the proposed strategy is language-independent and adaptable to large-scale multilingual corpora.

A Functional Database Framework for Querying Very Large Multi-Layer Corpora

Urheber*in: Schneider, Roman

Urheberrechtsschutz

0
/
0

Sprache
Englisch

Thema
Korpus <Linguistik>
Information Retrieval
Sprache

Ereignis
Geistige Schöpfung
(wer)
Schneider, Roman
Ereignis
Veröffentlichung
(wer)
Hamburg : Universität Hamburg
(wann)
2015-08-11

URN
urn:nbn:de:bsz:mh39-39705
Letzte Aktualisierung
06.03.2025, 09:00 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Konferenzbeitrag

Beteiligte

  • Schneider, Roman
  • Hamburg : Universität Hamburg

Entstanden

  • 2015-08-11

Ähnliche Objekte (12)