CONTACT

Utilitaires à télécharger

Vous trouverez ci-dessous la description de quelques utilitaires réalisés sous Excel dans le but de vous faciliter certains calculs. Ils sont libres, c'est à dire qu'ils peuvent être téléchargés, modifiés, copiés et distribués librement.
Afin d'éviter les erreurs certaines feuilles sont munies d'une protection dont la suppression ne nécessite aucun mot de passe. La méthode de calcul avec le logiciel R est indiquée dans la plupart des utilitaires.
Anastats vous propose formations et conseils en Statistiques, études de données, outils pour les statistiques à télécharger et de nombreux liens.

Ces utilitaires sont distribués sans aucune garantie. Ils fonctionnent avec toutes les versions d’Excel à partir d’Excel 97 et sous LibreOffice, à l’exception de Box plots. Bootstrap fonctionne sous LibreOffice, en demandant de conserver les macros à l’ouverture du fichier.

Tests non paramétriques

ANOVA et comparaisons multiples non paramétriques avec le logiciel R (tutoriel) 

Cet utilitaire traite quelques exemples de test ANOVA et de comparaisons multiples dans différentes situations avec le logiciel R. Pour faire gagner du temps à l'utilisateur, il favorise l'utlisation de boucles pré-programmées dans le cas de tableaux multivariés. Toutes les méthodes utilisées sont non paramétriques et utilisent soit les valeurs numériques (méthode des permutations), soit les rangs des valeurs. On donne également quelques exemples de représentations graphiques dans chaque situation.

Analyse non paramétrique des données longitudinales sous R (tutoriel)

L'outil décrit ici est la bibliothèque "nparLD" du logiciel R. Sa vocation est de traiter les expériences factorielles comportant des mesures répétées sur les mêmes individus, éventuellement croisées avec des facteurs à niveaux indépendants. S'agissant d'une approche non paramétrique, utilisant les rangs des valeurs, elle est adaptée aux petits échantillons, n'a pas d'exigence sur les distributions des valeurs, n'est pas sensible aux valeurs hors normes et s'adapte aussi bien à des données continues que ordinales ou même binaires. En outre elle accepte les données manquantes.

Test du Chi²

Cet outil permet de calculer automatiquement la statistique du Chi², sa significativité et le coefficient de contingence de Cramer sous Excel pour les dimensions de tableaux les plus courantes, jusqu'à 50 colonnes et 300 lignes. Il inclut la correction de Yates. Les conditions d'application du test sont indiquées. Une alerte avertit si elles ne sont pas respectées.

Test de Cochran

Cet outil réalise le test non paramétrique Q de Cochran pour la comparaison de plus de deux séries appariées de mesures en échelle binomiale. Les données doivent être insérées sous forme d'un tableau de 0 et de 1, les répétitions étant en colonnes et les individus en lignes. On est limité à 15 répétitions (en colonnes) et 100 individus (en lignes).

Test de Dixon

Cet outil permet d'effectuer le test de Dixon. Ce test permet de rechercher si une valeur extrême dans un petit échantillon (n compris entre 3 et 30) peut être considérée comme hors norme et donc enlevée de l'échantillon avant de réaliser un test statistique.

Test Z-score et test de Grubbs

Cet outil permet d'effectuer le test Z-score, et le test de Grubbs avec R. Ces tests permettent de rechercher la présence d'une (ou deux) valeur(s) hors norme dans un échantillon de plus de 30 individus.

Test de Friedman et comparaisons multiples

Cet outil réalise le test non paramétrique de Friedman pour la comparaison de plus de deux échantillons appariés. Il permet en outre les comparaisons deux à deux (= comparaisons multiples ou "post hoc") non paramétriques, tenant compte du nombre de groupes dans l'expérience. Il fournit également le coefficient de concordance de Kendall.

Test G

Le test G, plus connu sous le nom de Chi² du rapport de vraisemblance, est une alternative au test Chi² pour tester l'indépendance entre deux variables qualitatives ou comparer des proportions. Cet outil permet d'analyser des tables de contingence jusqu'à 10 colonnes et 50 lignes. Une feuille indique en outre comment réaliser le test avec le logiciel R.

Test du coefficient de concordance de Kendall

Ce document ne fournit pas de calcul mais des solutions logicielles permettant d'obtenir le coefficient de concordance W de Kendall qui permet d'évaluer la concordance entre plus de deux juges ou entre plus de deux variables.

Test de Kruskal & Wallis et comparaisons multiples

Cet outil réalise le test non paramétrique de Kruskal et Wallis pour la comparaison de plus de deux échantillons indépendants (jusqu'à 10 groupes de 50 individus maximum). Il permet en outre les comparaisons deux à deux (= comparaisons multiples ou "post hoc") non paramétriques, tenant compte du nombre de groupes dans l'expérience.

Test de Mac Nemar

Cet outil permet de réaliser le test de significativité de changement de McNemar. Il s'applique pour deux échantillons pairés mesurés en échelle binomiale.

Test de Mann & Whitney

Cet outil permet la comparaison non paramétrique de deux échantillons indépendants par le test de Mann & Whitney. Il s'applique à des échantillons inférieurs à 50. Les données peuvent être soit en échelle d'intervalle soit en échelle ordinale mais numériques.

Comparaison de deux proportions avec intervalle de confiance

Cet outil permet la comparaison de deux proportions mesurées sur deux échantillons indépendants. Utilisant une approche par la loi normale, cet outil permet le calcul d'intervalles de confiance encadrant la différence de proportions. Les calculs peuvent être effectués soit à partir des effectifs des différentes catégories, soit à partir des proportions observées. Une feuille indique la procédure avec le logiciel R.

Test du signe

Cet utilitaire permet de réaliser le test du signe, test non paramétrique utilisé pour comparer deux séries de mesures ordinales appariées. Il convient pour des séries composées de moins de 300 valeurs.

Test de corrélation de Spearman

Cet outil permet le calcul du coefficient de corrélation Rho de Spearman et le test de sa significativité. Il s'agit d'un test non paramétrique utilisant les rangs des valeurs. Il convient pour des petits échantillons : 5 < n < 100.

Test de Wilcoxon

Cet outil permet la comparaison non paramétrique de deux séries de valeurs appariées (= pairées). Il est adapté aux petits échantillons : 5 < n < 50. Les données doivent être en échelle d'intervalle.

Test du coefficient Kappa de Cohen

Cet outil permet d'évaluer l'agrément entre des juges classant un certain nombre d'objets (ou d'individus) dans des catégories nominales.

Test binomial

Cet outil permet de comparer une proportion observée à une valeur théorique.

Test des séries de Wald-Wolfowitz

Le test des séries (runs test) permet de tester si une série d'événements binaires, type pile ou face, s'est produite au hasard. Il permet aussi de tester si une série de mesures quantitatives, au cours du temps par exemple, évolue de manière aléatoire. Il permet enfin de tester si, à partir de mesures quantitatives, deux échantillons indépendants diffèrent sur la base de leurs dispersions. Une feuille indique une méthode pour réaliser le test avec le logiciel R.

Tests paramétriques

Analyse de variance à deux dimensions

Cet outil permet de réaliser une analyse de variance à deux dimensions pour deux facteurs indépendants avec des groupes de taille égale. Chaque facteur accepte jusqu'à 7 niveaux et l'effectif maximum par groupe est de n = 30. L'outil réalise la vérification des conditions d'application de l'analyse et la représentation graphique des effets.

Analyse de variance à une dimension pour mesures appariées

Cet outil permet de réaliser une analyse de variance à une dimension pour mesures répétées sur les mêmes individus. On peut analyser des mesures répétées jusqu'à 15 fois sur 100 individus au plus. L'outil réalise la vérification des conditions d'application de l'analyse et la représentation graphique des effets.

Analyse de variance à deux dimensions pour mesures appariées et indépendantes

Cet outil permet de réaliser une analyse de variance à deux dimensions, une dimension pour mesures répétées sur les mêmes individus et une dimension pour catégories indépendantes. On peut analyser des mesures répétées jusqu'à 15 fois sur 50 individus au plus par groupe et de 6 groupes indépendants au plus. Tous les groupes doivent être de même taille et tous les individus doivent avoir eu le même nombre de mesures répétées. L'outil réalise la vérification des conditions d'application de l'analyse et la représentation graphique des effets.

Analyse de variance à trois dimensions pour mesures appariées et indépendantes

Cet outil permet de réaliser une analyse de variance à trois dimensions, une dimension pour mesures répétées (= dépendantes) sur les mêmes individus et deux dimensions pour groupes indépendants. Les mesures dépendantes peuvent être répétées jusqu'à 15 fois sur 30 individus au plus par groupe. Chacune des deux variables composées de groupes indépendants peut avoir jusqu'à 5 groupes. Tous les groupes doivent être de même taille et tous les individus doivent avoir eu le même nombre de mesures répétées. L'outil réalise la vérification des conditions d'application de l'analyse et la représentation graphique des effets.

Test de Shapiro & Wilk

Cet utilitaire réalise le test de normalité de Shapiro & Wilk pour des échantillons de 3 à 500 individus. Il fournit également des statistiques élémentaires et quelques graphiques permettant d'observer la normalité. Il a été réalisé par Mohammad Ovais (Xepa-Soul Pattinson, Malaysia) et traduit en français par AnaStats. Seules les représentations graphiques ne sont pas fonctionnelles sous Open Office. La dernière feuille indique la méthode avec le logiciel R.

Test de Bartlett

Cet outil réalise le test de Bartlett de comparaison de plusieurs variances. On peut y placer jusqu'à 50 variances. Les groupes indépendants peuvent être d'effectifs différents mais leurs distributions doivent être normales.

Test du Fmax de Hartley

Cet outil permet de réaliser le test de Hartley, ou "test du Fmax" permettant de vérifier si des groupes indépendants présentent des variances significativement hétérogènes. Les groupes doivent être de même effectif et leurs distributions doivent être normales. Le test accepte jusqu'à 12 groupes différents.

Test de Levene

Cet outil permet de vérifier l'homogénéité des variances de plusieurs échantillons indépendants. Il accepte jusqu'à 12 groupes indépendants et au maximum 300 individus par groupe. Deux options sont proposées : le test de Levene (1960) proprement dit utilisant les écarts aux moyennes des groupes et le test de Brown & Forthyse (1974) utilisant les écarts aux médianes des groupes.

Coefficient alpha de Cronbach

Cet outil permet le calcul du coefficient alpha de Cronbach, pour tester la cohérence de différents items sensés mesurer la même information lors d'un questionnaire. Les données doivent être des quantitatives. On peut entrer jusqu'à 50 items différents et 1000 individus.

Test de corrélation de Bravais-Pearson

Cet utilitaire permet le calcul du coefficient de corrélation linéaire de Bravais-Pearson et teste sa significativité pour le cas de deux variables quantitatives.

Matrice de corrélation

Cet outil réalise une matrice de corrélations linéaires de Pearson à partir d'une série de variables en entrée (30 au plus). Il fournit en outre une matrice des valeurs de p associées. Il dispose en outre d'une feuille permettant la correction de Holm pour tests multiples. La méthode pour réaliser les mêmes calculs sous R est indiquée.

Comparaison d'une moyenne observée à une moyenne théorique

Ces feuilles de calculs permettent de comparer une moyenne observée à une moyenne théorique à l’aide du test de Student. Il est possible de comparer une moyenne obtenue avec une série de mesures, à une valeur donnée comme "norme" pour cette mesure par exemple ou encore de tester si une moyenne observée s'écarte significativement de zéro. De manière plus générale, il s'agit de comparer une moyenne d'échantillon à une moyenne de population.

Test de corrélation bisériale

Cet outil calcule les coefficients de corrélation bisériale et leur significativité entre une variable binaire et une variable quantitative normalement distribuée dans chacune des catégories.

Outils divers

Ajout d’éléments sur un graphique sous R
Initiation aux graphiques avec ggplot2 et ggpubr
Gestion des couleurs sous R
Graphiques en radar avec R
Détection et traitement des valeurs hors-normes 

Guide sous forme de didacticiel illustrant la détection et le traitement des valeurs hors-normes dans R.

Gestion des données manquantes 

Guide sous forme de didacticiel illustrant la gestion des données manquantes sous R.

Manipuler les données avec dplyr

(tutoriels) Un ensemble de guides pour modifier vos graphiques. Ajout et modification d'éléments tels que les couleurs, titres, légendes, axes, grilles, segments, textes, flèches, formes, etc. Également, un guide spécifique aux graphiques avec les bibliothèques ggplot2 et ggpubr. Un guide dédié à la gestion des couleurs sous R. Et enfin, un outil pour faciliter la récupération des scripts.

Normalité d'une distribution

Cet outil permet d'examiner différents indicateurs de normalité d'une distribution (nombre de valeurs hors norme, différence entre moyenne et médiane, coefficients d'applatissement et d'asymétrie, etc.) sans réaliser de "test" de la normalité proprement dit.

Calcul des Intervalles de confiance

Cet outil permet le calcul des intervalles de confiance

  • pour une moyenne, soit en collant les valeurs, soit en fournissant les paramètres,
  • pour une proportion.
  • pour une corrélation linéaire.
Calcul de la puissance d'un test

Cet outil vous permet de calculer la puissance pour un test de comparaison de deux échantillons indépendants ou de deux échantillons appariés, pour la comparaison de deux proportions, pour un test de corrélation, pour une analyse de variance à une dimension avec trois, quatre ou cinq groupes indépendants. Il permet aussi le test statistique de comparaison de deux corrélations linéaires indépendantes. Il réalise de plus l'analyse de variance à une dimension pour 3, 4 ou 5 groupes indépendants, en vérifiant les conditions d'application (homogénéité des variances). Il inclut un mode d'emploi et un exemple numérique sur les premières feuilles.

Contrôle du FDR pour comparaisons multiples

Cet outil permet le contrôle du "False Discovery Rate" lors de comparaisons multiples à l'issue d'une expérience fournissant de nombreuses p-values. Il permet de savoir, parmi les p-values trouvées, lesquelles permettent de rejeter l'hypothèse nulle. Il distingue les cas de p-values indépendantes et dépendantes. Il peut recevoir jusqu'à 500 p-values. Un outil disponible sous R pour effectuer les mêmes calculs est indiqué, ainsi que pour le calcul de la q-value.

Correction de Holm pour comparaisons multiples

La correction de Holm sert à corriger le seuil alpha lors de comparaisons multiples : comparaisons deux à deux à la suite d'une analyse de variance, comparaisons successives pour plusieurs variables mesurées dans la même expérience, corrélations deux à deux à partir d'une matrice de corrélations, etc. Cet utilitaire accepte jusqu'à 500 valeurs de p et fournit la p-value corrigée et le seuil alpha corrigé. Une feuille indique en outre comment réaliser le test avec le logiciel R.

Graphiques en boites de dispersion ou Box Plots

Cet outil permet de tracer sous Excel des diagrammes de Tukey (= boite et moustaches ; = box plot). Il accepte au plus 15 lots différents. Trois types de graphiques sont disponibles selon ce que l'on souhaite utiliser comme critère pour l'extrémité des "moustaches". Cet outil ne fonctionne ni sous Open Office ni sous FreeOffice.

Choix des tests statistiques

Cette archive comporte :

  • un fichier Excel permettant le choix des tests statistiques selon les situations expérimentales et présentant différents outils utilisables pour réaliser les tests.
  • un fichier Excel présentant une arborescence facilitant le choix d'un test statistique dans la plupart des cas classiques, selon le type de mesures, la problématique et la forme des données. Les fonctions du logiciel R correspondant à chaque test sont indiquées.
  • un document Word avec une grille de choix des tests non paramétriques.
Plans d'expériences

L'archive ci-dessous contient des outils qui permettent d'observer graphiquement les effets principaux et les interactions après la réalisation de quelques plans factoriels complets. Différentes feuilles proposent des solutions pour des plans à 2, 3 ou 4 dimensions avec des facteurs ayant de 2 à 4 niveaux. La première feuille de chaque fichier permet en outre le calcul du nombre minimum d'essais nécessaires pour un plan complet selon les niveaux de chaque facteur. Cette fonction est aussi celle du fichier "Plans mini".

Tirages bootstrap

Cet outil permet de réaliser des tirages bootstrap à partir d'un échantillon de valeurs. Il fournit la série des moyennes bootstrap demandées, ce qui permet d'examiner leur distribution, et les statistiques de base de la série bootstrap. Il inclut un mode d'emploi sur la première feuille. Cet utilitaire comportant des macro-commandes en Visual Basic, il ne fonctionne pas sous Open Office.

Tables statistiques

Le fichier comporte une dizaine de tables statistiques d'usage courant : rho de Spearman, r de Bravais-Pearson, t de Student, F de Fisher, z de la loi normale réduite, Chi², loi binomiale, coefficients et table de Shapiro-Wilk, Fmax, DW de Durbin-Watson. Un mode d'emploi est associé à chaque table.

L'approche Bayésienne en statistiques

Cette archive comporte un texte d'introduction à l'approche Bayésienne en statistiques et un utilitaire sous Excel permettant le calcul des valeurs prédictives d'un test diagnostique.

Nombre de fausses découvertes

Cet outil comporte une première feuille calculant la probabilité d'obtenir au moins une valeur de p significative à un seuil donné lors de la réalisation d'une série de tests statistiques dans une même expérience. Les feuilles suivantes montrent le résultat du test t de Student effectué sur des séries de valeurs aléatoires.

Rangs utiles

Cet outil permet de calculer les rangs d'une série de valeurs quantitatives. Il fournit deux traitements différents des ex æquo : le rang moyen (utilisé dans les tests non paramétriques) et le rang basé sur la valeur minimale (utilisé pour le classement des sportifs). La méthode avec le logiciel R est expliquée.

Valeurs prédictives

Cet outil permet de calculer les valeurs prédictives d'un test diagnostique.

Liens utiles

Actualités des statistiques, cours en ligne, logiciels.

CONTACT