Konferenzbeitrag

Compilation and Annotation of the Discourse-structured Blog Corpus for German

The present paper reports the first results of the compilation and annotation of a blog corpus for German. The main aim of the project is the representation of the blog discourse structure and relations between its elements (blog posts, comments) and participants (bloggers, commentators). The data included in the corpus were manually collected from the scientific blog portal SciLogs. The feature catalogue for the corpus annotation includes three types of information which is directly or indirectly provided in the blog or can be construed by means of statistical analysis or computational tools. At this point, only directly available information (e.g., title of the blog post, name of the blogger etc.) has been annotated. We believe, our blog corpus can be of interest for the general study of blog structure or related research questions as well as for the development of NLP methods and techniques (e.g. for authorship detection).

Urheber*in: Grumt Suárez, Holger; Karlova-Bourbonus, Natali; Lobin, Henning

Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International

Sprache: Englisch

Thema: Computerunterstützte Kommunikation
Korpus <Linguistik>
Text Encoding Initiative
Sprache

Ereignis: Geistige Schöpfung

(wer): Grumt Suárez, Holger
Karlova-Bourbonus, Natali
Lobin, Henning

Ereignis: Veröffentlichung

(wer): Ljubljana : Ljubljana University Press

(wann): 2018-06-29

URN: urn:nbn:de:bsz:mh39-75836

Letzte Aktualisierung: 06.03.2025, 09:00 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Leibniz-Institut für Deutsche Sprache - Bibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Original beim Datenpartner anzeigen

Objekttyp

Konferenzbeitrag

Beteiligte

Grumt Suárez, Holger
Karlova-Bourbonus, Natali
Lobin, Henning
Ljubljana : Ljubljana University Press

Entstanden

2018-06-29

Ähnliche Objekte (12)

Konferenzbeitrag

A Discourse-structured Blog Corpus for German: Challenges of Compilation and Annotation

Nachruf auf Ulrich Engel

Namenserweiterung als Bekenntnis zur Leibniz-Gemeinschaft

Ein CERN der deutschen Sprache. Überlegungen zu einem Dokumentationszentrum der deutschen Sprache

Nachruf auf Professor Dr. phil. Dr. h.c. Horst Sitta

Compilation and Annotation of the Discourse-structured Blog Corpus for German

Buchbeitrag

Bemerkungen zur andauernden Aktualität des Werks von Ulrich Engel

Wird aus Sprache Gewalt?

Sind Pandemien Lokomotiven der Sprachgeschichte?

Buchbeitrag

Aspekte der texttechnologischen Modellierung

Artikel

Nachruf auf Professor Dr. phil. Dr. h.c. Horst Sitta

Konferenzbeitrag

Grammatische Restringierung von Dateninhalten in SGML/XML

Konferenzbeitrag

A Discourse-structured Blog Corpus for German: Challenges of Compilation and Annotation

Nachruf auf Ulrich Engel

Namenserweiterung als Bekenntnis zur Leibniz-Gemeinschaft

Ein CERN der deutschen Sprache. Überlegungen zu einem Dokumentationszentrum der deutschen Sprache

Nachruf auf Professor Dr. phil. Dr. h.c. Horst Sitta

Compilation and Annotation of the Discourse-structured Blog Corpus for German

Buchbeitrag

Bemerkungen zur andauernden Aktualität des Werks von Ulrich Engel

Wird aus Sprache Gewalt?

Sind Pandemien Lokomotiven der Sprachgeschichte?

Buchbeitrag

Aspekte der texttechnologischen Modellierung

Artikel

Nachruf auf Professor Dr. phil. Dr. h.c. Horst Sitta

Konferenzbeitrag

Grammatische Restringierung von Dateninhalten in SGML/XML

Konferenzbeitrag

A Discourse-structured Blog Corpus for German: Challenges of Compilation and Annotation

Nachruf auf Ulrich Engel

Namenserweiterung als Bekenntnis zur Leibniz-Gemeinschaft

Ein CERN der deutschen Sprache. Überlegungen zu einem Dokumentationszentrum der deutschen Sprache

Nachruf auf Professor Dr. phil. Dr. h.c. Horst Sitta

Compilation and Annotation of the Discourse-structured Blog Corpus for German

Buchbeitrag

Bemerkungen zur andauernden Aktualität des Werks von Ulrich Engel

Wird aus Sprache Gewalt?

Sind Pandemien Lokomotiven der Sprachgeschichte?

Buchbeitrag

Aspekte der texttechnologischen Modellierung

Artikel

Nachruf auf Professor Dr. phil. Dr. h.c. Horst Sitta

Konferenzbeitrag

Grammatische Restringierung von Dateninhalten in SGML/XML

Informationen zur Registrierung von Kultur- und Wissenseinrichtungen finden Sie hier.

Felder mit * müssen ausgefüllt werden.

Benutzername*

Bitte geben Sie Ihren Benutzernamen ein

E-Mail*

Bitte geben Sie Ihre E-Mail ein

Bitte füllen Sie dieses Feld nicht aus

Vorname

Nachname

Passwort*

Bitte geben Sie Ihr Passwort ein

Passwort bestätigen*

Bitte geben Sie das gleiche Passwort ein

Ich habe die Nutzungsbedingungen und die Datenschutzerklärung zur Erhebung persönlicher Daten gelesen und stimme ihnen zu. *

Dieses Feld ist ein Pflichtfeld.

Ich möchte den Newsletter der Deutschen Digitalen Bibliothek abonnieren. Siehe Informationen zum Newsletter-Abonnement.

Benutzerkonto angelegt

Ihr „Meine DDB“-Konto wurde erfolgreich angelegt. Bevor Sie sich in Ihrem Konto anmelden können, müssen Sie auf den Bestätigungslink in der Nachricht klicken, die wir gerade an die von Ihnen angegebene E-Mail-Adresse geschickt haben

Compilation and Annotation of the Discourse-structured Blog Corpus for German

Download

Angaben zum Objekt

Klassifikation und Themen

Beteiligte, Orts- und Zeitangaben

Weitere Informationen

Datenpartner

Objekttyp

Beteiligte

Entstanden

Ähnliche Objekte (12)

A Discourse-structured Blog Corpus for German: Challenges of Compilation and Annotation

Nachruf auf Ulrich Engel

Namenserweiterung als Bekenntnis zur Leibniz-Gemeinschaft

Ein CERN der deutschen Sprache. Überlegungen zu einem Dokumentationszentrum der deutschen Sprache

Nachruf auf Professor Dr. phil. Dr. h.c. Horst Sitta

Compilation and Annotation of the Discourse-structured Blog Corpus for German

Bemerkungen zur andauernden Aktualität des Werks von Ulrich Engel

Wird aus Sprache Gewalt?

Sind Pandemien Lokomotiven der Sprachgeschichte?

Aspekte der texttechnologischen Modellierung

Nachruf auf Professor Dr. phil. Dr. h.c. Horst Sitta

Grammatische Restringierung von Dateninhalten in SGML/XML

A Discourse-structured Blog Corpus for German: Challenges of Compilation and Annotation

Nachruf auf Ulrich Engel

Namenserweiterung als Bekenntnis zur Leibniz-Gemeinschaft

Ein CERN der deutschen Sprache. Überlegungen zu einem Dokumentationszentrum der deutschen Sprache

Nachruf auf Professor Dr. phil. Dr. h.c. Horst Sitta

Compilation and Annotation of the Discourse-structured Blog Corpus for German

Bemerkungen zur andauernden Aktualität des Werks von Ulrich Engel

Wird aus Sprache Gewalt?

Sind Pandemien Lokomotiven der Sprachgeschichte?

Aspekte der texttechnologischen Modellierung

Nachruf auf Professor Dr. phil. Dr. h.c. Horst Sitta

Grammatische Restringierung von Dateninhalten in SGML/XML

A Discourse-structured Blog Corpus for German: Challenges of Compilation and Annotation

Nachruf auf Ulrich Engel

Namenserweiterung als Bekenntnis zur Leibniz-Gemeinschaft

Ein CERN der deutschen Sprache. Überlegungen zu einem Dokumentationszentrum der deutschen Sprache

Nachruf auf Professor Dr. phil. Dr. h.c. Horst Sitta

Compilation and Annotation of the Discourse-structured Blog Corpus for German

Bemerkungen zur andauernden Aktualität des Werks von Ulrich Engel

Wird aus Sprache Gewalt?

Sind Pandemien Lokomotiven der Sprachgeschichte?

Aspekte der texttechnologischen Modellierung

Nachruf auf Professor Dr. phil. Dr. h.c. Horst Sitta

Grammatische Restringierung von Dateninhalten in SGML/XML

Verbundene Objekte

Passwort zurücksetzen