CONTACT
0

Apprentissage statistique : régressions et analyses discriminantes

Modéliser des phénomènes et faire des prédictions à partir de tableaux de données complexes. Toute une panoplie d’outils à votre service.

Fiche formation

Description

Public concerné

Techniciens, ingénieurs ou chercheurs souhaitant prendre des décisions à partir de grands tableaux de données. Des compétences en mathématiques ne sont pas nécessaires.

Prérequis

Maîtrise de l’analyse de variance.

Objectifs

Savoir choisir et utiliser les méthodes de régressions et d'analyses discriminantes permettant de modéliser un phénomène et de faire des prédictions. Utiliser des logiciels adaptés et interpréter les résultats.

Méthode

L’enseignement s’appuie sur l’utilisation du logiciel XLSTAT ou du logiciel R. Pour chaque question étudiée on donne une explication sans recours à des notions mathématiques complexes. Pour chaque technique, les stagiaires traitent un exemple en vraie grandeur, éventuellement sur leurs données. On examine les sorties logicielles en insistant sur les difficultés d’interprétation.

Durée et autres formalités

Durée : Trois jours

Interentreprises (Tours ou La Teste-de-Buch)

Nombre de stagiaires limité à 6. Dates : nous consulter

Intra-entreprise

Groupe de 12 personnes au plus. Dates : à définir avec le client.

Prix :

1249 €/personne interentreprises
4287 € intra-entreprise

Nos formations sont exonérées de TVA. Un tarif dégressif s'appliquera à partir de 3 formations facturées.

Programme de la formation

Les outils de la fouille des données
  • Apprentissage statistique et Machine Learning
  • Le surapprentissage et comment l’éviter
  • La bibliothèque caret
Les régressions et leurs conditions de validité
  • Présentation et description des données
  • La régression linéaire multiple
    • Conditions de validité
    • Mise en œuvre
    • Régression pas à pas
  • La régression PLS
    • Intérêts ; Interprétation des sorties logicielles et des graphiques factoriels
    • Interprétation des résultats de la régression
    • Classement des variables
    • Estimation de la qualité du modèle
  • Comparaisons de modèles et bilan
  • Exercices en autonomie
Les analyses discriminantes
  • Généralités, matrice de confusion et courbe ROC
  • Importance des variables, prévision de nouveaux cas
  • Présentation et description des données
  • L’analyse discriminante linéaire
  • La régression logistique
  • L’analyse discriminante sur facteurs, PLS-DA
  • Les forêts aléatoires (RandomForest)
  • Les réseaux de neurones
  • Les méthodes à vecteurs support (SVM)
  • Aspects théoriques. Conditions de validité. Mise en œuvre
  • Comparaisons de modèles et bilan
  • Exercices en autonomie
CONTACT
Aperçu du panier