Arbeitspapier

How valid can data fusion be?

Data fusion techniques typically aim to achieve a complete data file from different sources which do not contain the same units. Traditionally, this is done on the basis of variables common to all files. It is well known that those approaches establish conditional independence of the specific variables given the common variables, although they may be conditionally dependent in reality. We discuss the objectives of data fusion in the light of their feasibility and distinguish four levels of validity that a fusion technique may achieve. For a rather general situation, we derive the feasible set of correlation matrices for the variables not jointly observed and suggest a new quality index for data fusion. Finally, we present a suitable and effcient multiple imputation procedure to make use of auxiliary information and to overcome the conditional independence assumption.

Sprache
Englisch

Erschienen in
Series: IAB-Discussion Paper ; No. 15/2006

Klassifikation
Wirtschaft
Bayesian Analysis: General
Statistical Simulation Methods: General
Methodology for Collecting, Estimating, and Organizing Microeconomic Data; Data Access
Thema
Daten
Datenaufbereitung
Datenqualität
Korrelation
Validität
angewandte Statistik
mathematische Statistik

Ereignis
Geistige Schöpfung
(wer)
Kiesl, Hans
Rässler, Susanne
Ereignis
Veröffentlichung
(wer)
Institut für Arbeitsmarkt- und Berufsforschung (IAB)
(wo)
Nürnberg
(wann)
2006

Handle
Letzte Aktualisierung
10.03.2025, 11:43 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
ZBW - Deutsche Zentralbibliothek für Wirtschaftswissenschaften - Leibniz-Informationszentrum Wirtschaft. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Objekttyp

  • Arbeitspapier

Beteiligte

  • Kiesl, Hans
  • Rässler, Susanne
  • Institut für Arbeitsmarkt- und Berufsforschung (IAB)

Entstanden

  • 2006

Ähnliche Objekte (12)