Challenges for the development of automated RNA-seq analyses pipelines

Abstract: Background: Transcriptional changes are hallmarks of development and disease. RNA sequencing (RNA-seq) allows qualitative and quantitative RNA expression analysis. Raw RNA-seq data passes through a multi-step computational pipeline to derive meaning from such measurements. Often ad hoc scripts are used for such analyses. However, the use of workflow management systems (WFMS) should be encouraged in order to enhance result reproducibility, to establish best data analysis practices, and to share such data analysis workflows. In this work, we created RNA-seq data analysis workflows in three WFMS, namely Galaxy (free, open-source), KNIME (free, commercial, and partially open source), and CLC (commercial, closed source). Methods: These tools were compared using a variety of criteria ranging from installation to workflow execution and sharing. Four different workflows (WFs) performing RNA-seq data analysis were successfully constructed in all three WFMS. In summary, Galaxy currently ...
Abstract: Hintergrund: Transkriptionelle Veränderungen sind Kennzeichen von Entwicklung und Krankheit. RNA-Sequenzierung (RNA-seq) ermöglicht die qualitative und quantitative Analyse der RNA-Expression. Rohdaten von RNA-seq durchlaufen typischerweise eine mehrstufige, computergestützte Pipeline, um aus solchen Messungen eine Bedeutung abzuleiten. Oft werden dafür Ad-hoc-Skripte verwendet. Allerdings sollte die Verwendung von Workflow-Management-Systemen (WFMS) gefördert werden, um die Reproduzierbarkeit von Ergebnissen zu verbessern, bewährte Datenanalyseverfahren zu etablieren und solche Workflows zur Datenanalyse zu teilen. In dieser Arbeit haben wir RNA-seq Datenanalyse-Workflows in drei WFMS erstellt, namentlich: Galaxy (kostenlos, Open Source), KNIME (kostenlos, kommerziell und teilweise Open Source) und CLC (kommerziell, Closed Source).Methoden: Diese Werkzeuge wurden anhand einer Vielzahl von Kriterien verglichen, von der Installation bis zur Ausführung und Freigabe von Workflows. ...

Alternative title
Herausforderungen bei der Entwicklung automatisierter RNA-seq Analyse-Pipelines
Location
Deutsche Nationalbibliothek Frankfurt am Main
Extent
Online-Ressource
Language
Englisch

Bibliographic citation
Challenges for the development of automated RNA-seq analyses pipelines ; volume:19 ; day:04 ; month:07 ; year:2023
GMS Medizinische Informatik, Biometrie und Epidemiologie ; 19 (04.07.2023)

Classification
Medizin, Gesundheit

Creator
Beukers, Matthieu
Allmer, Jens

DOI
10.3205/mibe000245
URN
urn:nbn:de:0183-mibe0002457
Rights
Open Access; Der Zugriff auf das Objekt ist unbeschränkt möglich.
Last update
14.08.2025, 10:59 AM CEST

Data provider

This object is provided by:
Deutsche Nationalbibliothek. If you have any questions about the object, please contact the data provider.

Associated

  • Beukers, Matthieu
  • Allmer, Jens

Other Objects (12)