Buchbeitrag

KoGra-DB: Using MapReduce for language corpora

Linguistic query systems are special purpose IR applications. We present a novel state-of-the-art approach for the efficient exploitation of very large linguistic corpora, combining the advantages of relational database management systems (RDBMS) with the functional MapReduce programming model. Our implementation uses the German DEREKO reference corpus with multi-layer linguistic annotations and several types of text-specific metadata, but the proposed strategy is language-independent and adaptable to large-scale multilingual corpora.

Urheber*in: Schneider, Roman

In copyright

Language: Englisch

Subject: Korpus <Linguistik>
Automatische Sprachanalyse
Sprache

Event: Geistige Schöpfung

(who): Schneider, Roman

Event: Veröffentlichung

(who): Bonn-Buschdorf : Köllen

(when): 2018-02-02

URN: urn:nbn:de:bsz:mh39-70363

Last update: 06.03.2025, 9:00 AM CET

Data provider

This object is provided by:
Leibniz-Institut für Deutsche Sprache - Bibliothek. If you have any questions about the object, please contact the data provider.

Show original at data provider

Object type

Buchbeitrag

Associated

Schneider, Roman
Bonn-Buschdorf : Köllen

Time of origin

2018-02-02

Other Objects (12)

Hochschulschrift

Durch Kobaltintoxikation am Meerschweinchen erzeugte Organveränderungen und über Versuche, die toxische Wirkung von Kobalt durch Calciumgaben aufzuheben : (lichtmikroskop. u. ultrastrukturelle Befunde)

Hochschulschrift

Vergleichende Untersuchung über histologische und immunfluoreszenzoptische Befunde bei bullösem Pemphigoid, Dermatitis herpetiformis und lineärer IgA-Dermatose

Buchbeitrag

KoGra-R: Standardisierte statistische Auswertung von Korpusrecherchen

Konferenzbeitrag

GenitivDB - a corpus-generated database for German genitive classification

“… jetzt auch im praktischen Hypertextformat” – Die Anfänge der Grammatik mit der Maus

Konferenzbeitrag

Eine Ontologie für die Grammatik. Modellierung und Einsatzgebiete domänspezifischer Wissensstrukturen

Artikel

Möller, Max: Das Partizip II von Experiencer-Objekt-Verben. Eine korpuslinguistische Untersuchung. – Tübingen: Narr Francke Attempto, 2015. 394 S.; Ill. (Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache; 6) ISBN 978-3-8233-6964-6 [Rezension]

Artikel

Zwischen Schriftlichkeit und Mündlichkeit: Songtexte in der deskriptiven Sprachforschung

Buchbeitrag

Example-based querying for linguistic specialist corpora

Buchbeitrag

„... jetzt auch im praktischen Hypertextformat“ - Die Anfänge der Grammatik mit der Maus

Buchbeitrag

Texttechnologie und Grammatik

Buchbeitrag

A database-driven ontology for German grammar

Hochschulschrift

Durch Kobaltintoxikation am Meerschweinchen erzeugte Organveränderungen und über Versuche, die toxische Wirkung von Kobalt durch Calciumgaben aufzuheben : (lichtmikroskop. u. ultrastrukturelle Befunde)

Hochschulschrift

Vergleichende Untersuchung über histologische und immunfluoreszenzoptische Befunde bei bullösem Pemphigoid, Dermatitis herpetiformis und lineärer IgA-Dermatose

Buchbeitrag

KoGra-R: Standardisierte statistische Auswertung von Korpusrecherchen

Konferenzbeitrag

GenitivDB - a corpus-generated database for German genitive classification

“… jetzt auch im praktischen Hypertextformat” – Die Anfänge der Grammatik mit der Maus

Konferenzbeitrag

Eine Ontologie für die Grammatik. Modellierung und Einsatzgebiete domänspezifischer Wissensstrukturen

Artikel

Möller, Max: Das Partizip II von Experiencer-Objekt-Verben. Eine korpuslinguistische Untersuchung. – Tübingen: Narr Francke Attempto, 2015. 394 S.; Ill. (Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache; 6) ISBN 978-3-8233-6964-6 [Rezension]

Artikel

Zwischen Schriftlichkeit und Mündlichkeit: Songtexte in der deskriptiven Sprachforschung

Buchbeitrag

Example-based querying for linguistic specialist corpora

Buchbeitrag

„... jetzt auch im praktischen Hypertextformat“ - Die Anfänge der Grammatik mit der Maus

Buchbeitrag

Texttechnologie und Grammatik

Buchbeitrag

A database-driven ontology for German grammar

Hochschulschrift

Durch Kobaltintoxikation am Meerschweinchen erzeugte Organveränderungen und über Versuche, die toxische Wirkung von Kobalt durch Calciumgaben aufzuheben : (lichtmikroskop. u. ultrastrukturelle Befunde)

Hochschulschrift

Vergleichende Untersuchung über histologische und immunfluoreszenzoptische Befunde bei bullösem Pemphigoid, Dermatitis herpetiformis und lineärer IgA-Dermatose

Buchbeitrag

KoGra-R: Standardisierte statistische Auswertung von Korpusrecherchen

Konferenzbeitrag

GenitivDB - a corpus-generated database for German genitive classification

“… jetzt auch im praktischen Hypertextformat” – Die Anfänge der Grammatik mit der Maus

Konferenzbeitrag

Eine Ontologie für die Grammatik. Modellierung und Einsatzgebiete domänspezifischer Wissensstrukturen

Artikel

Möller, Max: Das Partizip II von Experiencer-Objekt-Verben. Eine korpuslinguistische Untersuchung. – Tübingen: Narr Francke Attempto, 2015. 394 S.; Ill. (Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache; 6) ISBN 978-3-8233-6964-6 [Rezension]

Artikel

Zwischen Schriftlichkeit und Mündlichkeit: Songtexte in der deskriptiven Sprachforschung

Buchbeitrag

Example-based querying for linguistic specialist corpora

Buchbeitrag

„... jetzt auch im praktischen Hypertextformat“ - Die Anfänge der Grammatik mit der Maus

Buchbeitrag

Texttechnologie und Grammatik

Buchbeitrag

A database-driven ontology for German grammar

Cultural heritage institutions wishing to register will find more information here.

Fields marked * need to be filled in.

Username*

Please enter your username

Email*

Please enter your email address

Please do not fill this field

First name

Last name

Password*

Please enter your password

Confirm password*

Please enter the same password

I have read the terms of use and the privacy policy for the collection of personal data and accept them. *

This field is required.

I would like to subscribe to the newsletter of the Deutsche Digitale Bibliothek. See newsletter subscription info.

Account created

Your "My DDB" account has been successfully created. Before you can log in to your account, you must click the confirmation link in the message we just sent to the email address you provided.

KoGra-DB: Using MapReduce for language corpora

Download

Object Details

Classification and Topics

Contributors, Places and Time

Further information

Data provider

Object type

Associated

Time of origin

Other Objects (12)

Durch Kobaltintoxikation am Meerschweinchen erzeugte Organveränderungen und über Versuche, die toxische Wirkung von Kobalt durch Calciumgaben aufzuheben : (lichtmikroskop. u. ultrastrukturelle Befunde)

Vergleichende Untersuchung über histologische und immunfluoreszenzoptische Befunde bei bullösem Pemphigoid, Dermatitis herpetiformis und lineärer IgA-Dermatose

KoGra-R: Standardisierte statistische Auswertung von Korpusrecherchen

GenitivDB - a corpus-generated database for German genitive classification

“… jetzt auch im praktischen Hypertextformat” – Die Anfänge der Grammatik mit der Maus

Eine Ontologie für die Grammatik. Modellierung und Einsatzgebiete domänspezifischer Wissensstrukturen

Möller, Max: Das Partizip II von Experiencer-Objekt-Verben. Eine korpuslinguistische Untersuchung. – Tübingen: Narr Francke Attempto, 2015. 394 S.; Ill. (Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache; 6) ISBN 978-3-8233-6964-6 [Rezension]

Zwischen Schriftlichkeit und Mündlichkeit: Songtexte in der deskriptiven Sprachforschung

Example-based querying for linguistic specialist corpora

„... jetzt auch im praktischen Hypertextformat“ - Die Anfänge der Grammatik mit der Maus

Texttechnologie und Grammatik

A database-driven ontology for German grammar

Durch Kobaltintoxikation am Meerschweinchen erzeugte Organveränderungen und über Versuche, die toxische Wirkung von Kobalt durch Calciumgaben aufzuheben : (lichtmikroskop. u. ultrastrukturelle Befunde)

Vergleichende Untersuchung über histologische und immunfluoreszenzoptische Befunde bei bullösem Pemphigoid, Dermatitis herpetiformis und lineärer IgA-Dermatose

KoGra-R: Standardisierte statistische Auswertung von Korpusrecherchen

GenitivDB - a corpus-generated database for German genitive classification

“… jetzt auch im praktischen Hypertextformat” – Die Anfänge der Grammatik mit der Maus

Eine Ontologie für die Grammatik. Modellierung und Einsatzgebiete domänspezifischer Wissensstrukturen

Möller, Max: Das Partizip II von Experiencer-Objekt-Verben. Eine korpuslinguistische Untersuchung. – Tübingen: Narr Francke Attempto, 2015. 394 S.; Ill. (Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache; 6) ISBN 978-3-8233-6964-6 [Rezension]

Zwischen Schriftlichkeit und Mündlichkeit: Songtexte in der deskriptiven Sprachforschung

Example-based querying for linguistic specialist corpora

„... jetzt auch im praktischen Hypertextformat“ - Die Anfänge der Grammatik mit der Maus

Texttechnologie und Grammatik

A database-driven ontology for German grammar

Durch Kobaltintoxikation am Meerschweinchen erzeugte Organveränderungen und über Versuche, die toxische Wirkung von Kobalt durch Calciumgaben aufzuheben : (lichtmikroskop. u. ultrastrukturelle Befunde)

Vergleichende Untersuchung über histologische und immunfluoreszenzoptische Befunde bei bullösem Pemphigoid, Dermatitis herpetiformis und lineärer IgA-Dermatose

KoGra-R: Standardisierte statistische Auswertung von Korpusrecherchen

GenitivDB - a corpus-generated database for German genitive classification

“… jetzt auch im praktischen Hypertextformat” – Die Anfänge der Grammatik mit der Maus

Eine Ontologie für die Grammatik. Modellierung und Einsatzgebiete domänspezifischer Wissensstrukturen

Möller, Max: Das Partizip II von Experiencer-Objekt-Verben. Eine korpuslinguistische Untersuchung. – Tübingen: Narr Francke Attempto, 2015. 394 S.; Ill. (Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache; 6) ISBN 978-3-8233-6964-6 [Rezension]

Zwischen Schriftlichkeit und Mündlichkeit: Songtexte in der deskriptiven Sprachforschung

Example-based querying for linguistic specialist corpora

„... jetzt auch im praktischen Hypertextformat“ - Die Anfänge der Grammatik mit der Maus

Texttechnologie und Grammatik

A database-driven ontology for German grammar

Related objects

Reset password