Conference paper | Konferenzbeitrag

Mining Social Science Publications for Survey Variables

Research in Social Science is usually based on survey data where individual research questions relate to observable concepts (variables). However, due to a lack of standards for data citations a reliable identification of the variables used is often difficult. In this paper, we present a work-in-progress study that seeks to provide a solution to the variable detection task based on supervised machine learning algorithms, using a linguistic analysis pipeline to extract a rich feature set, including terminological concepts and similarity metric scores. Further, we present preliminary results on a small dataset that has been specifically designed for this task, yielding modest improvements over the baseline.

Umfang
Seite(n): 47-52
Sprache
Englisch
Anmerkungen
Status: Postprint; begutachtet (peer reviewed)

Erschienen in
Proceedings of the Second Workshop on NLP and Computational Social Science

Thema
Literatur, Rhetorik, Literaturwissenschaft
Publizistische Medien, Journalismus,Verlagswesen
Literaturwissenschaft, Sprachwissenschaft, Linguistik
Informationswissenschaft
Datengewinnung
künstliche Intelligenz
Begriff
Algorithmus
Computerlinguistik
Befragung
Publikation
Sozialwissenschaft
Fachliteratur
Indikatorenbildung
Zeitschrift

Ereignis
Geistige Schöpfung
(wer)
Zielinski, Andrea
Mutschke, Peter
Ereignis
Veröffentlichung
(wer)
Association for Computational Linguistics (ACL)
(wann)
2017

URN
urn:nbn:de:0168-ssoar-57722-7
Rechteinformation
GESIS - Leibniz-Institut für Sozialwissenschaften. Bibliothek Köln
Letzte Aktualisierung
21.06.2024, 16:27 MESZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
GESIS - Leibniz-Institut für Sozialwissenschaften. Bibliothek Köln. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Konferenzbeitrag

Beteiligte

  • Zielinski, Andrea
  • Mutschke, Peter
  • Association for Computational Linguistics (ACL)

Entstanden

  • 2017

Ähnliche Objekte (12)