Konferenzbeitrag

Evaluating a Dependency Parser on DeReKo

We evaluate a graph-based dependency parser on DeReKo, a large corpus of contemporary German. The dependency parser is trained on the German dataset from the SPMRL 2014 Shared Task which contains text from the news domain, whereas DeReKo also covers other domains including fiction, science, and technology. To avoid the need for costly manual annotation of the corpus, we use the parser’s probability estimates for unlabeled and labeled attachment as main evaluation criterion. We show that these probability estimates are highly correlated with the actual attachment scores on a manually annotated test set. On this basis, we compare estimated parsing scores for the individual domains in DeReKo, and show that the scores decrease with increasing distance of a domain to the training corpus.

Evaluating a Dependency Parser on DeReKo

Urheber*in: Fankhauser, Peter; Do, Bich-Ngoc; Kupietz, Marc

Namensnennung - Nicht kommerziell 4.0 International

0
/
0

Sprache
Englisch

Thema
Korpus <Linguistik>
Parser
Evaluation
Zuverlässigkeit
Computerlinguistik
Sprache

Ereignis
Geistige Schöpfung
(wer)
Fankhauser, Peter
Do, Bich-Ngoc
Kupietz, Marc
Ereignis
Veröffentlichung
(wer)
Paris : European Language Resources Association
(wann)
2020-05-12

URN
urn:nbn:de:bsz:mh39-98138
Letzte Aktualisierung
06.03.2025, 09:00 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Konferenzbeitrag

Beteiligte

  • Fankhauser, Peter
  • Do, Bich-Ngoc
  • Kupietz, Marc
  • Paris : European Language Resources Association

Entstanden

  • 2020-05-12

Ähnliche Objekte (12)