Arbeitspapier

Similarity Measures for Clustering SNP and Epidemiological Data

The issue of suitable similarity measures for a joint consideration of so called SNP data and epidemiological variables arises from the GENICA (Interdisciplinary Study Group on Gene Environment Interaction and Breast Cancer in Germany) casecontrol study of sporadic breast cancer. The GENICA study aims to investigate the influence and interaction of single nucleotide polymorphic (SNP) loci and exogenous risk factors. A single nucleotide polymorphism is a point mutation that is present in at least 1 % of a population. SNPs are the most common form of human genetic variations. In particular, we consider 43 SNP loci in genes involved in the metabolism of hormones, xenobiotics and drugs as well as in the repair of DNA. Assuming that these single nucleotide changes may lead, for instance, to altered enzymes or to a reduced or enhanced amount of the original enzymes – with each alteration alone having minor effects – the aim is to detect combinations of SNPs that under certain environmental conditions increase the risk of sporadic breast cancer. The search for patterns in the present data set may be performed by a variety of clustering and classification approaches. I consider here the problem of suitable measures of proximity of two variables or subjects as an indispensable basis for a further cluster analysis. In the present data situation these measures have to be able to handle different numbers and meaning of categories of nominal scaled data as well as data of different scales. Generally, clustering approaches are a useful tool to detect structures and to generate hypothesis about potential relationships in complex data situations. Searching for patterns in the data there are two possible objectives: the identification of groups of similar objects or subjects or the identification of groups of similar variables within the whole or within subpopulations. The different objectives imply different requirements on the measures of similarity. Comparing the individual genetic profiles as well as comparing the genetic information across subpopulations I discuss possible choices of similarity measures suitable for genetic and epidemiological data, in particular, measures based on the ÷2-statistic, Flexible Matching Coefficients and combinations of similarity measures.

Sprache: Englisch

Erschienen in: Series: Technical Report ; No. 2006,25

Thema: GENICA
single nucleotide polymorphism (SNP)
sporadic breast cancer
similarity
cluster analysis
Flexible Matching Coefficient

Ereignis: Geistige Schöpfung

(wer): Selinski, Silvia

Ereignis: Veröffentlichung

(wer): Universität Dortmund, Sonderforschungsbereich 475 - Komplexitätsreduktion in Multivariaten Datenstrukturen

(wo): Dortmund

(wann): 2006

Handle: http://hdl.handle.net/10419/22668

Letzte Aktualisierung: 10.03.2025, 11:44 MEZ

Datenpartner

Dieses Objekt wird bereitgestellt von:
ZBW - Deutsche Zentralbibliothek für Wirtschaftswissenschaften - Leibniz-Informationszentrum Wirtschaft. Bei Fragen zum Objekt wenden Sie sich bitte an den Datenpartner.

Original beim Datenpartner anzeigen

Objekttyp

Arbeitspapier

Beteiligte

Selinski, Silvia
Universität Dortmund, Sonderforschungsbereich 475 - Komplexitätsreduktion in Multivariaten Datenstrukturen

Entstanden

2006

Ähnliche Objekte (12)

Similarity measures for clustering SNP and epidemiological data

Arbeitspapier

Similarity Measures for Clustering SNP Data

Arbeitspapier

Cluster Analysis : A Comparison of Different Similarity Measures for SNP Data

Cluster Analysis : A Comparision of Different Similarity Measures for SNP Data

GO functional similarity clustering depends on similarity measure, clustering method, and annotation completeness

Measures of Neural Similarity

Learning similarity measures from data

Hochschulschrift

Similarity measures for scientific workflows

Fast approximate hierarchical clustering using similarity heuristics

Sense and Similarity: A Study of Sense-level Similarity Measures

The Knowledge Contained in Similarity Measures

Similarity measures for clustering SNP and epidemiological data

Arbeitspapier

Similarity Measures for Clustering SNP Data

Arbeitspapier

Cluster Analysis : A Comparison of Different Similarity Measures for SNP Data

Cluster Analysis : A Comparision of Different Similarity Measures for SNP Data

GO functional similarity clustering depends on similarity measure, clustering method, and annotation completeness

Measures of Neural Similarity

Learning similarity measures from data

Hochschulschrift

Similarity measures for scientific workflows

Fast approximate hierarchical clustering using similarity heuristics

Sense and Similarity: A Study of Sense-level Similarity Measures

The Knowledge Contained in Similarity Measures

Similarity measures for clustering SNP and epidemiological data

Arbeitspapier

Similarity Measures for Clustering SNP Data

Arbeitspapier

Cluster Analysis : A Comparison of Different Similarity Measures for SNP Data

Cluster Analysis : A Comparision of Different Similarity Measures for SNP Data

GO functional similarity clustering depends on similarity measure, clustering method, and annotation completeness

Measures of Neural Similarity

Learning similarity measures from data

Hochschulschrift

Similarity measures for scientific workflows

Fast approximate hierarchical clustering using similarity heuristics

Sense and Similarity: A Study of Sense-level Similarity Measures

The Knowledge Contained in Similarity Measures

Informationen zur Registrierung von Kultur- und Wissenseinrichtungen finden Sie hier.

Felder mit * müssen ausgefüllt werden.

Benutzername*

Bitte geben Sie Ihren Benutzernamen ein

E-Mail*

Bitte geben Sie Ihre E-Mail ein

Bitte füllen Sie dieses Feld nicht aus

Vorname

Nachname

Passwort*

Bitte geben Sie Ihr Passwort ein

Passwort bestätigen*

Bitte geben Sie das gleiche Passwort ein

Ich habe die Datenschutzerklärung zur Erhebung persönlicher Daten gelesen und stimme ihr zu.*

Dieses Feld ist ein Pflichtfeld.

Ich möchte den Newsletter der Deutschen Digitalen Bibliothek abonnieren. Siehe Informationen zum Newsletter-Abonnement.

Benutzerkonto angelegt

Ihr „Meine DDB“-Konto wurde erfolgreich angelegt. Bevor Sie sich in Ihrem Konto anmelden können, müssen Sie auf den Bestätigungslink in der Nachricht klicken, die wir gerade an die von Ihnen angegebene E-Mail-Adresse geschickt haben

Similarity Measures for Clustering SNP and Epidemiological Data

Objekt anzeigen

Verweise und Beziehungen

Klassifikation und Themen

Beteiligte, Orts- und Zeitangaben

Weitere Informationen

Datenpartner

Objekttyp

Beteiligte

Entstanden

Ähnliche Objekte (12)

Similarity measures for clustering SNP and epidemiological data

Similarity Measures for Clustering SNP Data

Similarity Measures for Clustering SNP Data

Cluster Analysis : A Comparison of Different Similarity Measures for SNP Data

Cluster Analysis : A Comparision of Different Similarity Measures for SNP Data

GO functional similarity clustering depends on similarity measure, clustering method, and annotation completeness

Measures of Neural Similarity

Learning similarity measures from data

Similarity measures for scientific workflows

Fast approximate hierarchical clustering using similarity heuristics

Sense and Similarity: A Study of Sense-level Similarity Measures

The Knowledge Contained in Similarity Measures

Similarity measures for clustering SNP and epidemiological data

Similarity Measures for Clustering SNP Data

Similarity Measures for Clustering SNP Data

Cluster Analysis : A Comparison of Different Similarity Measures for SNP Data

Cluster Analysis : A Comparision of Different Similarity Measures for SNP Data

GO functional similarity clustering depends on similarity measure, clustering method, and annotation completeness

Measures of Neural Similarity

Learning similarity measures from data

Similarity measures for scientific workflows

Fast approximate hierarchical clustering using similarity heuristics

Sense and Similarity: A Study of Sense-level Similarity Measures

The Knowledge Contained in Similarity Measures

Similarity measures for clustering SNP and epidemiological data

Similarity Measures for Clustering SNP Data

Similarity Measures for Clustering SNP Data

Cluster Analysis : A Comparison of Different Similarity Measures for SNP Data

Cluster Analysis : A Comparision of Different Similarity Measures for SNP Data

GO functional similarity clustering depends on similarity measure, clustering method, and annotation completeness

Measures of Neural Similarity

Learning similarity measures from data

Similarity measures for scientific workflows

Fast approximate hierarchical clustering using similarity heuristics

Sense and Similarity: A Study of Sense-level Similarity Measures

The Knowledge Contained in Similarity Measures

Verbundene Objekte

Passwort zurücksetzen