Reproducible Research II: Practices and tools for managing computations and data

Reproducible Research II: Practices and tools for managing computations and data

课程
en
英语
35 时
此内容评级为 0/5
来源
  • 来自www.fun-mooc.fr
更多信息
  • 3 序列
  • 等级 中级
  • 从15 五月 2024开始
  • 以3 九月 2024结束

Their employees are learning daily with Edflex

  • Safran
  • Air France
  • TotalEnergies
  • Generali
Learn more

课程详情

教学大纲

Module 1: Managing data
1.1 Archiving
1.2 File formats
1.3 Project Organization
1.4 Git Annex

Module 2: Managing software
2.1 On the Importance of Software Environment
2.2 Package Management Principles
2.3 Isolation and Containers
2.4 Using Containers
2.5 Building and Sharing Containers
2.6 Functional Package Managers (Guix, Docker, Singularity...)

Module 3: Managing computations
3.1 Why do we need workflows?
3.2 From notebooks to shell scripts
3.3 Workflows with `make`
3.4 Workflows with `snakemake`
3.5 Workflows and environments

先决条件

This course is for everyone who relies on a computer to perform data analysis. You should have some experience with running commands in a terminal, and have a basic knowledge of git (at the level of the first MOOC) and scientific Python.

讲师

Arnaud Legrand
Arnaud Legrand est chercheur au CNRS au Laboratoire d'Informatique de Grenoble. Ses recherches portent sur l'évaluation de la performance des grandes infrastructures de calcul. Pour réaliser des expériences et analyser les résultats, il est essentiel de capturer le processus de manière rigoureuse.

Christophe Pouzat
Christophe Pouzat est chercheur au CNRS à l'IRMA (Institut de Recherche Mathématique Avancée, Université de Strasbourg). Il est en fait neurophysiologiste et travaille sur l'analyse des données expérimentales. La recherche reproductible lui permet de communiquer explicitement avec les expérimentateurs, évitant ainsi de nombreuses erreurs.

Konrad Hinsen
Konrad Hinsen est chercheur au CNRS au Centre de Biophysique Moléculaire d'Orléans et au Synchrotron SOLEIL de Saint Aubin. Il explore la structure et la dynamique des protéines par des méthodes informatiques qu'il tente de rendre reproductibles.

Matthieu Simonin
Matthieu Simonin est ingénieur de recherche au centre Inria de l'université de Rennes. Il travaille au contact des équipes étudiant les systèmes distribués et apporte son soutien pour mener des campagnes expérimentales qui voient s'entremêler des contraintes matérielles, logicielles et des manipulations de données. Depuis peu, Matthieu a rejoint le GDR du labos1point5 en aidant au développement des outils de quantification carbone des activités de recherche, dont les calculs doivent bien sûr être reproductibles !

Ludovic Courtès
Ludovic Courtès est ingénieur de recherche Inria à Bordeaux. Il contribue à Guix, un logiciel libre permettant de déployer des environnements logiciels de manière reproductible, avec pour objectif d’en faire un outil de base pour la recherche reproductible.

Kim Tâm HUYNH
Kim Tâm HUYNH est ingénieure de recherche dans le SED (Service Expérimentation et Développement) du centre Inria de Paris. Elle s'intéresse aux méthodologies et outillages pour le développement logiciel de recherche.

编辑

法国国家计算机科学与控制研究所(INRIA)是法国一家专门从事数学和计算机科学研究的公共科技机构,由高等教育、研究和创新部以及经济和财政部共同管理。 它成立于 1967 年 1 月 3 日。

Inria 的使命是在国内和国际上发展信息与通信科学和技术方面的研究和技术转让。该机构还负责指导法国在人工智能研究方面的国家战略。

平台

France Université Numérique est le diffuseur des cours en ligne des établissements d’enseignement supérieur français et de leurs partenaires.

Il opère plusieurs plateformes de diffusion, dont la plus connue, FUN MOOC, est la première plateforme académique francophone mondiale. Grâce à de nombreux établissements partenaires, cette plateforme propose un vaste catalogue de cours s’enrichissant de jour en jour avec des thématiques variées et d’actualité.
 

此内容评级为 4.5/5
(没有评论)
此内容评级为 4.5/5
(没有评论)
完成这个资源,写一篇评论