Conference paper | Konferenzbeitrag
Mining Social Science Publications for Survey Variables
Research in Social Science is usually based on survey data where individual research questions relate to observable concepts (variables). However, due to a lack of standards for data citations a reliable identification of the variables used is often difficult. In this paper, we present a work-in-progress study that seeks to provide a solution to the variable detection task based on supervised machine learning algorithms, using a linguistic analysis pipeline to extract a rich feature set, including terminological concepts and similarity metric scores. Further, we present preliminary results on a small dataset that has been specifically designed for this task, yielding modest improvements over the baseline.
- Umfang
-
Seite(n): 47-52
- Sprache
-
Englisch
- Anmerkungen
-
Status: Postprint; begutachtet (peer reviewed)
- Erschienen in
-
Proceedings of the Second Workshop on NLP and Computational Social Science
- Thema
-
Literatur, Rhetorik, Literaturwissenschaft
Publizistische Medien, Journalismus,Verlagswesen
Literaturwissenschaft, Sprachwissenschaft, Linguistik
Informationswissenschaft
Datengewinnung
künstliche Intelligenz
Begriff
Algorithmus
Computerlinguistik
Befragung
Publikation
Sozialwissenschaft
Fachliteratur
Indikatorenbildung
Zeitschrift
- Ereignis
-
Geistige Schöpfung
- (wer)
-
Zielinski, Andrea
Mutschke, Peter
- Ereignis
-
Veröffentlichung
- (wer)
-
Association for Computational Linguistics (ACL)
- (wann)
-
2017
- URN
-
urn:nbn:de:0168-ssoar-57722-7
- Rechteinformation
-
GESIS - Leibniz-Institut für Sozialwissenschaften. Bibliothek Köln
- Letzte Aktualisierung
-
21.06.2024, 16:27 MESZ
Datenpartner
GESIS - Leibniz-Institut für Sozialwissenschaften. Bibliothek Köln. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.
Objekttyp
- Konferenzbeitrag
Beteiligte
- Zielinski, Andrea
- Mutschke, Peter
- Association for Computational Linguistics (ACL)
Entstanden
- 2017