CONTACT

Analyse statistique des données textuelles avec IRaMuTeQ

Des logiciels spécialisés permettent aujourd’hui l’analyse automatique des langues naturelles. Les méthodes multivariées permettent une exploitation poussée de ces données, questions ouvertes dans les enquêtes, entretiens, veille technologique.

Fiche formation

Description

Public concerné

Techniciens, ingénieurs ou chercheurs confrontés à l’exploitation de données textuelles. La connaissance des méthodes descriptives multifactorielles (AFC en particulier) est souhaitable.

Prérequis

Savoir interpréter le résultat d'un test Chi². Un questionnaire préalable permettra leur évaluation.

Objectifs pédagogiques

  • Se familiariser avec le vocabulaire spécifique aux analyses lexicales
  • Comprendre l'intérêt et l'utilisation de segments de texte
  • Maîtriser la fonction de la lemmatisation et savoir la paramétrer
  • Réaliser l'analyse des spécificités. Comprendre et en interpréter les sorties logicielles
  • Comprendre le principe de la classification descendante et savoir interpréter ses résultats
  • Comprendre le principe, réaliser et interpréter l'analyse des similitudes
  • Savoir construire un nuage de mots et en comprendre la fonction, les limites et l'utilisation
  • Évaluer l'intérêt, réaliser et interpréter une analyse prototypique

Méthode

La formation consiste en des parties théoriques, puis dirigées (démonstration par l’exemple), puis de mise en situation lors d’applications pratiques (exercices en autonomie avec correction de groupe). Après une courte introduction les stagiaires apprennent à utiliser l'interface du logiciel libre Iramuteq (travaillant à partir des bibliothèques du logiciel R). La méthode Reinert de classification et une approche très fine des contextes de mots par les analyses de similitudes sont expliquées. A partir d'un exemple d'enquête sociologique comportant des questions fermées et ouvertes, ils réalisent en pratique l'ensemble de l'analyse. Les éléments théoriques sont présentés sans recours à des connaissances particulières en mathématiques.

Évaluation  

L’évaluation se fait au travers de la réalisation d’exercices en autonomie et d’un questionnaire final de validation des acquis.

Durée et autres formalités

Durée : Deux jours

Interentreprises (Tours)

Nombre de stagiaires limité à 6. Dates : nous consulter

Intra-entreprise

Groupe de 12 personnes au plus. Dates : à définir avec le client.

Prix 2025 :

1192 €/personne interentreprises
3448 € intra-entreprise

Nos formations sont exonérées de TVA.

Programme de la formation

Généralités
Présentation du logiciel IRaMuTeQ
  • Présentation générale.
  • Principes de fonctionnement.
  • Paramétrage du texte et importation
Lemmatisation et statistiques élémentaires
  • Lemmatisation : Définitions, Mise en œuvre.
  • Statistiques élémentaires.
Spécificités et AFC
  • Rappels sur l’analyse des correspondances : Fonction de l'AFC, Rappel sur le Chi², Les calculs de l’AFC, Lecture du graphe factoriel d’une AFC.
Classification méthode Reinert
  • Principe de la classification descendante hiérarchique sur segments de texte.
  • Mise en œuvre de la classification : Paramétrage de la classification, Lecture et interprétation.
Analyses de similitudes
  • Principe.
  • Mise en œuvre des analyses de similitudes : Paramétrage de l'analyse, Lecture et interprétation, Autres graphes de similitudes.
Nuages de mots
  • Généralités.
  • Mise en œuvre : Paramétrage, Lecture.
Analyse de matrices et analyse prototypique
  • Généralités.
  • Mise en œuvre : Fréquences, Fréquences multiples, Chi², Classification, Analyses de similitude, Analyse prototypique.
Limites de l'analyse automatique du texte
Exercices en autonomie

CONTACT