Reproducible Research II: Practices and tools for managing computations and data

Reproducible Research II: Practices and tools for managing computations and data

Course
en
English
35 h
This content is rated 0 out of 5
Source
  • From www.fun-mooc.fr
More info
  • 3 Sequences
  • Intermediate Level
  • Starts on May 15, 2024
  • Ends on September 3, 2024

Their employees are learning daily with Edflex

  • Safran
  • Air France
  • TotalEnergies
  • Generali
Learn more

Course details

Syllabus

Module 1: Managing data
1.1 Archiving
1.2 File formats
1.3 Project Organization
1.4 Git Annex

Module 2: Managing software
2.1 On the Importance of Software Environment
2.2 Package Management Principles
2.3 Isolation and Containers
2.4 Using Containers
2.5 Building and Sharing Containers
2.6 Functional Package Managers (Guix, Docker, Singularity...)

Module 3: Managing computations
3.1 Why do we need workflows?
3.2 From notebooks to shell scripts
3.3 Workflows with `make`
3.4 Workflows with `snakemake`
3.5 Workflows and environments

Prerequisite

This course is for everyone who relies on a computer to perform data analysis. You should have some experience with running commands in a terminal, and have a basic knowledge of git (at the level of the first MOOC) and scientific Python.

Instructors

Arnaud Legrand
Arnaud Legrand est chercheur au CNRS au Laboratoire d'Informatique de Grenoble. Ses recherches portent sur l'évaluation de la performance des grandes infrastructures de calcul. Pour réaliser des expériences et analyser les résultats, il est essentiel de capturer le processus de manière rigoureuse.

Christophe Pouzat
Christophe Pouzat est chercheur au CNRS à l'IRMA (Institut de Recherche Mathématique Avancée, Université de Strasbourg). Il est en fait neurophysiologiste et travaille sur l'analyse des données expérimentales. La recherche reproductible lui permet de communiquer explicitement avec les expérimentateurs, évitant ainsi de nombreuses erreurs.

Konrad Hinsen
Konrad Hinsen est chercheur au CNRS au Centre de Biophysique Moléculaire d'Orléans et au Synchrotron SOLEIL de Saint Aubin. Il explore la structure et la dynamique des protéines par des méthodes informatiques qu'il tente de rendre reproductibles.

Matthieu Simonin
Matthieu Simonin est ingénieur de recherche au centre Inria de l'université de Rennes. Il travaille au contact des équipes étudiant les systèmes distribués et apporte son soutien pour mener des campagnes expérimentales qui voient s'entremêler des contraintes matérielles, logicielles et des manipulations de données. Depuis peu, Matthieu a rejoint le GDR du labos1point5 en aidant au développement des outils de quantification carbone des activités de recherche, dont les calculs doivent bien sûr être reproductibles !

Ludovic Courtès
Ludovic Courtès est ingénieur de recherche Inria à Bordeaux. Il contribue à Guix, un logiciel libre permettant de déployer des environnements logiciels de manière reproductible, avec pour objectif d’en faire un outil de base pour la recherche reproductible.

Kim Tâm HUYNH
Kim Tâm HUYNH est ingénieure de recherche dans le SED (Service Expérimentation et Développement) du centre Inria de Paris. Elle s'intéresse aux méthodologies et outillages pour le développement logiciel de recherche.

Editor

The French National Institute for Research in Computer Science and Control (INRIA) is a public scientific and technological establishment specialising in mathematics and computer science, under the joint authority of the Ministry of Higher Education, Research and Innovation and the Ministry of the Economy and Finance1. It was set up on 3 January 1967 as part of the "Plan Calcul".

Inria's mission is to develop research and technology transfer in information and communication sciences and techniques, both nationally and internationally. The institute also steers France's national strategy in terms of artificial intelligence research.

Platform

France Université Numérique is the broadcaster of the online courses of French higher education institutions and their partners.

It operates several platforms of diffusion, of which the best known, FUN MOOC, is the first French-speaking academic platform worldwide. Thanks to many partner institutions, this platform offers a vast catalog of courses enriched daily with various themes and current events.

This content is rated 4.5 out of 5
(no review)
This content is rated 4.5 out of 5
(no review)
Complete this resource to write a review