CONTACT
0

Introduction à l'analyse de données à haut débit avec le logiciel R

Les biologistes sont maintenant très nombreux à produire des données à haut débit. Des milliers de variables avec des petits effectifs posent des problèmes spécifiques mais les outils sont aujourd'hui disponibles pour répondre à ces défis.

Fiche formation

Description

Public concerné

Chercheurs, ingénieurs, techniciens, doctorants ayant à traiter des données issues de spectrométrie, de protéomique, de métabolomique ou génomique (les omiques).

Prérequis

Il est indispensable que les participants aient de bonne connaissances des outils statistiques de base (statistiques descriptives, tests d'hypothèses, intervalles de confiances, p-value, seuil de risque, etc.).

Objectifs

Savoir tirer de l’information intéressante à partir des jeux de données complexes obtenus par les méthodes de séquençage haut-débit.

Méthode

Après une présentation générale des défis particuliers associés à ce type de données, on présente les méthodes descriptives puis décisionnelles, sans recours à des notions mathématiques complexes. Tout au long de la formation, les stagiaires mettent les acquis en pratique – en autonomie – sur données réelles. Une rapide introduction au logiciel R est proposée si nécessaire.

Durée et autres formalités

Durée : Trois jours

Interentreprises (Tours ou La Teste-de-Buch)

Nombre de stagiaires limité à 6. Dates : nous consulter

Intra-entreprise

Groupe de 12 personnes au plus. Dates : à définir avec le client.

Prix :

1249 €/personne interentreprises
4287 € intra-entreprise

Nos formations sont exonérées de TVA. Un tarif dégressif s'appliquera à partir de 3 formations facturées.

Programme de la formation

Introduction
    • Données "OMIQUES", qu'est-ce que c'est ?
    • Données brutes et matrices d'expression
    • Problématiques et défis particuliers
    • Logiciels
Brève introduction au logiciel R
Pratique sur données réelles : manipulations préliminaires
      • Chargement et résumé
      • Quelques graphiques simples
      • Travailler sur les log de quantités
      • Transformation d'un tableau de données en matrice d'expression
      • Contrôle de qualité des données
      • Filtrage non spécifique et filtrage spécifique
Statistiques descriptives exploratoires
      • L'analyse en composantes principales (ACP)
      • Classification ascendante hiérarchique (CAH)
      • Heatmap
Statistiques décisionnelles
      • Tests usuels paramétriques et non paramétriques
      • Tri des variables
      • Inflation du risque alpha et comparaisons multiples
      • Pratique : correction des p-values
      • Vérifications par rééchantillonnage
Pratique en autonomie sur des jeux de données réelles.

CONTACT
Aperçu du panier