Konferenzbeitrag

Using a domain ontology for the semantic-statistical classification of specialist hypertexts

In this feasibility study we aim at contributing at the practical use of domain ontologies for hypertext classification by introducing an algorithm generating potential keywords. The algorithm uses structural markup information and lemmatized word lists as well as a domain ontology on linguistics. We present the calculation and ranking of keyword candidates based on ontology relationships, word position, frequency information, and statistical significance as evidenced by log-likelihood tests. Finally, the results of our machine-driven classification are validated empirically against manually assigned keywords.

Using a domain ontology for the semantic-statistical classification of specialist hypertexts

Urheber*in: Schneider, Roman; Bubenhofer, Noah

Urheberrechtsschutz

0
/
0

Sprache
Englisch

Thema
Linguistische Datenverarbeitung
Wissenspräsentation
Semantisches Netz
Grammatik
Deutsch
Germanische Sprachen; Deutsch

Ereignis
Geistige Schöpfung
(wer)
Schneider, Roman
Bubenhofer, Noah
Ereignis
Veröffentlichung
(wann)
2015-08-17

URN
urn:nbn:de:bsz:mh39-39840
Letzte Aktualisierung
06.03.2025, 09:00 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Konferenzbeitrag

Beteiligte

  • Schneider, Roman
  • Bubenhofer, Noah

Entstanden

  • 2015-08-17

Ähnliche Objekte (12)