Netboost: statistical modeling strategies for high-dimensional data

zu Verbundenen Objekten

Abstract: Background:
State-of-the art methods often fail to identify weak but cumulative effects of variables found in high-dimensional omics datasets. Nevertheless, these effects play important roles in many diseases, such as the clonal development of leukemic cells and CKD metabolism.

Results:
We propose Netboost, a three-step dimension reduction technique. First, boosting-based filters are combined with the topological overlap measure to identify the essential edges of the network. Second, sparse hierarchical clustering is applied on the selected edges to identify modules and finally, module information is aggregated by principal components. The primary analysis is then carried out on these summary measures instead of the original data, allowing for a localized dimensionality reduction.

We demonstrate the application of the newly developed Netboost in integration with CoxBoost for survival prediction, genetic association studies to understand the human metabolism and random forests for disease classification. We applied our method in 7 independent cohorts spanning 6 diseases, a variety of high-dimensional data types (DNA methylation, metabolomics, miRNA, RNA arrays, RNA sequencing) and human as well as murine in vivo samples.
In many of these settings, we were able to show significant advantages over state-of-the-art competitive analysis strategies with respect to prediction errors, power and mis-classification rates by cross-validation, general resampling and independent replication.

By integration of our novel method in analysis of several biomedical research projects, we were able to attain and confirm biological insights which could not have been reached by the compared state-of-the-art methods.
In particular, the two biologically most insightful findings in this dissertation were both replicated in independent datasets.
First, we identified a chromatin modifying enzyme signature associated with overall survival, which separates patients into two groups with a threefold difference in median survival time. Second, we established the central concept in the human urinary metabolism to be the list of ADME processes, which was originally defined in the context of pharmacological research.

Furthermore, we demonstrated in several datasets a lower sampling uncertainty of Netboost overall networks as well as individual components of the networks across Netboost, WGCNA and k-means and found that method uncertainty dominated sampling uncertainty.

Finally, we integrate Netboost with robust methodology designing a Netboost adaption, which is invariant to monotone transformations of variables and thus obtain an advantageous extension in cases of non-linear relationships between variables.

Conclusion:
The newly developed approach Netboost offers a versatile statistical modeling strategy for high-dimensional data, which is
freely available as a Bioconductor R package. Via dimensionality reduction it improves accuracy, power and stability in various analysis settings, including time-to-event analysis, GWAS and classification

Standort: Deutsche Nationalbibliothek Frankfurt am Main

Umfang: Online-Ressource

Sprache: Englisch

Anmerkungen: Universität Freiburg, Dissertation, 2019

Klassifikation: Naturwissenschaften

Ereignis: Veröffentlichung

(wo): Freiburg

(wer): Universität

(wann): 2019

Urheber: Schlosser, Pascal

Beteiligte Personen und Organisationen: Schumacher, Martin
Albert-Ludwigs-Universität Freiburg. Fakultät für Mathematik und Physik

DOI: 10.6094/UNIFR/151256

URN: urn:nbn:de:bsz:25-freidok-1512562

Rechteinformation: Kein Open Access; Der Zugriff auf das Objekt ist unbeschränkt möglich.

Letzte Aktualisierung: 14.08.2025, 10:53 MESZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
Deutsche Nationalbibliothek. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Original beim Datenpartner anzeigen

Beteiligte

Entstanden

2019

Ähnliche Objekte (12)

Hochschulschrift

Kritische Bibliographie zu Wolframs "Parzival" 1945-1958

Hochschulschrift

Der Zerfall des 4,4-min-Rh104m. : (Gekürzte Fassg.) Mit 7 Fig. im Text

Hochschulschrift

Über asymptotische Potenzreihen in zwei Veränderlichen und ein zweidimensionales Momentenproblem

Dominanz-Disharmonierung und Begleitsymptomatik bei der kongenitalen Legasthenie

Namensähnlichkeit als Ausschließungsgrund? Der Fall der Frankfurter Anwältin Elfriede Cohnen und die Säuberung der Anwaltschaft in Preußen 1933

Hochschulschrift

Model complexity selection in high-dimensional time-to-event data analysis : = Modelkomplexitätswahl in der Ereigniszeitanalyse hochdimensionaler Daten

Hochschulschrift

Statistical modeling strategies for linking multiple molecular sources to time-to-event endpoints : = Statistische Modellbildungsstrategien zur Verknüpfung multipler molekularer Quellen unter Berücksichtigung von Time-to-Event Endpunkten

Hochschulschrift

Clinical trials for personalized, marker-based treatment strategies

12 leichte danzas latinas : für Gitarre solo = 12 easy danzas latinas

Statistische Analyse von Experimenten in der biomedizinischen Forschung

Mittelstandsfront und Republik : die Wirtschaftspartei, Reichspartei d. dt. Mittelstandes 1919 - 1933

Konferenzschrift | Kongress

Perspectives on photon interactions with hadrons and nuclei : proceedings of a workshop held at Göttingen, FRG on 20 and 21 February 1990

Hochschulschrift

Kritische Bibliographie zu Wolframs "Parzival" 1945-1958

Hochschulschrift

Der Zerfall des 4,4-min-Rh104m. : (Gekürzte Fassg.) Mit 7 Fig. im Text

Hochschulschrift

Über asymptotische Potenzreihen in zwei Veränderlichen und ein zweidimensionales Momentenproblem

Dominanz-Disharmonierung und Begleitsymptomatik bei der kongenitalen Legasthenie

Namensähnlichkeit als Ausschließungsgrund? Der Fall der Frankfurter Anwältin Elfriede Cohnen und die Säuberung der Anwaltschaft in Preußen 1933

Hochschulschrift

Model complexity selection in high-dimensional time-to-event data analysis : = Modelkomplexitätswahl in der Ereigniszeitanalyse hochdimensionaler Daten

Hochschulschrift

Statistical modeling strategies for linking multiple molecular sources to time-to-event endpoints : = Statistische Modellbildungsstrategien zur Verknüpfung multipler molekularer Quellen unter Berücksichtigung von Time-to-Event Endpunkten

Hochschulschrift

Clinical trials for personalized, marker-based treatment strategies

12 leichte danzas latinas : für Gitarre solo = 12 easy danzas latinas

Statistische Analyse von Experimenten in der biomedizinischen Forschung

Mittelstandsfront und Republik : die Wirtschaftspartei, Reichspartei d. dt. Mittelstandes 1919 - 1933

Konferenzschrift | Kongress

Perspectives on photon interactions with hadrons and nuclei : proceedings of a workshop held at Göttingen, FRG on 20 and 21 February 1990

Hochschulschrift

Kritische Bibliographie zu Wolframs "Parzival" 1945-1958

Hochschulschrift

Der Zerfall des 4,4-min-Rh104m. : (Gekürzte Fassg.) Mit 7 Fig. im Text

Hochschulschrift

Über asymptotische Potenzreihen in zwei Veränderlichen und ein zweidimensionales Momentenproblem

Dominanz-Disharmonierung und Begleitsymptomatik bei der kongenitalen Legasthenie

Namensähnlichkeit als Ausschließungsgrund? Der Fall der Frankfurter Anwältin Elfriede Cohnen und die Säuberung der Anwaltschaft in Preußen 1933

Hochschulschrift

Model complexity selection in high-dimensional time-to-event data analysis : = Modelkomplexitätswahl in der Ereigniszeitanalyse hochdimensionaler Daten

Hochschulschrift

Statistical modeling strategies for linking multiple molecular sources to time-to-event endpoints : = Statistische Modellbildungsstrategien zur Verknüpfung multipler molekularer Quellen unter Berücksichtigung von Time-to-Event Endpunkten

Hochschulschrift

Clinical trials for personalized, marker-based treatment strategies

12 leichte danzas latinas : für Gitarre solo = 12 easy danzas latinas

Statistische Analyse von Experimenten in der biomedizinischen Forschung

Mittelstandsfront und Republik : die Wirtschaftspartei, Reichspartei d. dt. Mittelstandes 1919 - 1933

Konferenzschrift | Kongress

Perspectives on photon interactions with hadrons and nuclei : proceedings of a workshop held at Göttingen, FRG on 20 and 21 February 1990

Informationen zur Registrierung von Kultur- und Wissenseinrichtungen finden Sie hier.

Felder mit * müssen ausgefüllt werden.

Benutzername*

Bitte geben Sie Ihren Benutzernamen ein

E-Mail*

Bitte geben Sie Ihre E-Mail ein

Bitte füllen Sie dieses Feld nicht aus

Vorname

Nachname

Passwort*

Bitte geben Sie Ihr Passwort ein

Passwort bestätigen*

Bitte geben Sie das gleiche Passwort ein

Ich habe die Nutzungsbedingungen und die Datenschutzerklärung zur Erhebung persönlicher Daten gelesen und stimme ihnen zu. *

Dieses Feld ist ein Pflichtfeld.

Ich möchte den Newsletter der Deutschen Digitalen Bibliothek abonnieren. Siehe Informationen zum Newsletter-Abonnement.

Benutzerkonto angelegt

Ihr „Meine DDB“-Konto wurde erfolgreich angelegt. Bevor Sie sich in Ihrem Konto anmelden können, müssen Sie auf den Bestätigungslink in der Nachricht klicken, die wir gerade an die von Ihnen angegebene E-Mail-Adresse geschickt haben

Netboost: statistical modeling strategies for high-dimensional data

Angaben zum Objekt

Klassifikation und Themen

Beteiligte, Orts- und Zeitangaben

Weitere Informationen

Datenpartner

Beteiligte

Entstanden

Ähnliche Objekte (12)

Kritische Bibliographie zu Wolframs "Parzival" 1945-1958

Der Zerfall des 4,4-min-Rh104m. : (Gekürzte Fassg.) Mit 7 Fig. im Text

Über asymptotische Potenzreihen in zwei Veränderlichen und ein zweidimensionales Momentenproblem

Dominanz-Disharmonierung und Begleitsymptomatik bei der kongenitalen Legasthenie

Namensähnlichkeit als Ausschließungsgrund? Der Fall der Frankfurter Anwältin Elfriede Cohnen und die Säuberung der Anwaltschaft in Preußen 1933

Model complexity selection in high-dimensional time-to-event data analysis : = Modelkomplexitätswahl in der Ereigniszeitanalyse hochdimensionaler Daten

Statistical modeling strategies for linking multiple molecular sources to time-to-event endpoints : = Statistische Modellbildungsstrategien zur Verknüpfung multipler molekularer Quellen unter Berücksichtigung von Time-to-Event Endpunkten

Clinical trials for personalized, marker-based treatment strategies

12 leichte danzas latinas : für Gitarre solo = 12 easy danzas latinas

Statistische Analyse von Experimenten in der biomedizinischen Forschung

Mittelstandsfront und Republik : die Wirtschaftspartei, Reichspartei d. dt. Mittelstandes 1919 - 1933

Perspectives on photon interactions with hadrons and nuclei : proceedings of a workshop held at Göttingen, FRG on 20 and 21 February 1990

Kritische Bibliographie zu Wolframs "Parzival" 1945-1958

Der Zerfall des 4,4-min-Rh104m. : (Gekürzte Fassg.) Mit 7 Fig. im Text

Über asymptotische Potenzreihen in zwei Veränderlichen und ein zweidimensionales Momentenproblem

Dominanz-Disharmonierung und Begleitsymptomatik bei der kongenitalen Legasthenie

Namensähnlichkeit als Ausschließungsgrund? Der Fall der Frankfurter Anwältin Elfriede Cohnen und die Säuberung der Anwaltschaft in Preußen 1933

Model complexity selection in high-dimensional time-to-event data analysis : = Modelkomplexitätswahl in der Ereigniszeitanalyse hochdimensionaler Daten

Statistical modeling strategies for linking multiple molecular sources to time-to-event endpoints : = Statistische Modellbildungsstrategien zur Verknüpfung multipler molekularer Quellen unter Berücksichtigung von Time-to-Event Endpunkten

Clinical trials for personalized, marker-based treatment strategies

12 leichte danzas latinas : für Gitarre solo = 12 easy danzas latinas

Statistische Analyse von Experimenten in der biomedizinischen Forschung

Mittelstandsfront und Republik : die Wirtschaftspartei, Reichspartei d. dt. Mittelstandes 1919 - 1933

Perspectives on photon interactions with hadrons and nuclei : proceedings of a workshop held at Göttingen, FRG on 20 and 21 February 1990

Kritische Bibliographie zu Wolframs "Parzival" 1945-1958

Der Zerfall des 4,4-min-Rh104m. : (Gekürzte Fassg.) Mit 7 Fig. im Text

Über asymptotische Potenzreihen in zwei Veränderlichen und ein zweidimensionales Momentenproblem

Dominanz-Disharmonierung und Begleitsymptomatik bei der kongenitalen Legasthenie

Namensähnlichkeit als Ausschließungsgrund? Der Fall der Frankfurter Anwältin Elfriede Cohnen und die Säuberung der Anwaltschaft in Preußen 1933

Model complexity selection in high-dimensional time-to-event data analysis : = Modelkomplexitätswahl in der Ereigniszeitanalyse hochdimensionaler Daten

Statistical modeling strategies for linking multiple molecular sources to time-to-event endpoints : = Statistische Modellbildungsstrategien zur Verknüpfung multipler molekularer Quellen unter Berücksichtigung von Time-to-Event Endpunkten

Clinical trials for personalized, marker-based treatment strategies

12 leichte danzas latinas : für Gitarre solo = 12 easy danzas latinas

Statistische Analyse von Experimenten in der biomedizinischen Forschung

Mittelstandsfront und Republik : die Wirtschaftspartei, Reichspartei d. dt. Mittelstandes 1919 - 1933

Perspectives on photon interactions with hadrons and nuclei : proceedings of a workshop held at Göttingen, FRG on 20 and 21 February 1990

Verbundene Objekte

Passwort zurücksetzen