Types de validité en recherche

La validité fait référence à la capacité d’un test ou d’une expérience à accomplir ce pour quoi il est prévu.

Par exemple :

  • il est maintenant largement reconnu que le test de QI standard ne mesure pas réellement l’intelligence, ni ne prédit le succès dans la vie, indiquant une faible validité.
  • à l’inverse, un test de grossesse standard est précis à environ 99%, ce qui signifie qu’il a une très haute validité et donc une mesure fiable.

Il existe plusieurs façons de déterminer la validité dans la recherche. Ces méthodes permettent d’évaluer si les résultats obtenus sont pertinents et précis pour répondre aux questions de recherche posées.

Types de validité

Dans la recherche, la validité est un aspect important pour garantir la fiabilité et l’exactitude des résultats. Voici les principaux types de validité.

1. Validité faciale

La validité faciale est une mesure qui permet d’évaluer si un test ou une échelle semble aborder le sujet qu’il souhaite mesurer. En d’autres termes, les questions doivent sembler être logiquement liées au concept étudié.

Par exemple, un test de personnalité qui mesure l’intelligence émotionnelle devrait inclure des questions sur la conscience de soi et l’empathie, et non des questions sur les mathématiques ou la chimie.

Pour évaluer la validité faciale, une méthode courante consiste à consulter un panel d’experts qui examinent le test et évaluent son adéquation comme instrument de mesure du sujet. Si les experts conviennent que le test mesure ce qu’il vise à mesurer, alors le test est considéré comme ayant une validité faciale.

Il est important que le test présente une validité faciale, car si ce n’est pas le cas, les personnes qui le prennent ne le prendront pas au sérieux. Cronbach (1970) explique ce phénomène :

Dans le cas d’un patient qui perd confiance en un médicament prescrit par son médecin, le médicament perd une grande partie de son pouvoir thérapeutique. Le patient peut négliger de le prendre et finalement renoncer aux soins médicaux.

Ainsi, il est essentiel de tenir compte de la validité faciale lors de la sélection d’un test, non seulement pour s’assurer de la précision des résultats, mais aussi pour garantir l’engagement des participants et l’acceptation des résultats par les personnes concernées.

2. Validité de contenu

La validité de contenu fait référence à la capacité d’un test ou d’une échelle à mesurer tous les éléments d’un concept donné. Par exemple, si l’intelligence émotionnelle (IE) comporte cinq dimensions, une échelle qui mesure l’IE doit contenir des questions concernant chaque dimension.

Semblable à la validité faciale, la validité de contenu peut être évaluée en demandant à des experts en la matière d’examiner le test. Si les experts conviennent que le test comprend des éléments qui évaluent chaque domaine du concept, alors le test a une validité de contenu.

Prenons l’exemple de la partie mathématiques du SAT, qui contient des questions nécessitant des compétences dans différents types de mathématiques : arithmétique, algèbre, géométrie, calcul et bien d’autres. Comme il y a des questions qui évaluent chaque type de mathématiques, le test possède une validité de contenu.

Le concepteur du test peut demander aux EM d’évaluer la validité de contenu du test. Si tous les EM donnent des notes élevées au test, alors il a une validité de contenu.

3. Validité de construction

La validité de construction est la mesure dans laquelle un outil d’évaluation évalue réellement ce pour quoi il a été conçu d’évaluer.

Voici les deux principales méthodes pour évaluer la validité de construction : validité convergente et validité discriminante.

  • Validité convergente : consiste à prendre deux tests censés mesurer la même construction et à les administrer à un échantillon de participants. Plus la corrélation entre les deux tests est élevée, plus la validité de construction est forte.
  • Validité discriminante : implique l’administration de deux tests mesurant des constructions complètement différentes au même échantillon de participants. Comme les tests mesurent des constructions différentes, il devrait y avoir une très faible corrélation entre les deux.

4. Validité interne

La validité interne concerne l’effet des manipulations des variables indépendantes ou de traitement sur les résultats d’une expérience.

Par exemple, un chercheur souhaite comprendre comment la température influence la volonté d’aider. Pour cette expérience, il place les participants dans différentes salles :

  • Température normale
  • Température modérément chaude
  • Température très chaude

Ensuite, on demande aux participants de faire un don à une association locale avant de poursuivre l’étude. Les résultats montrent que les dons diminuent à mesure que la température augmente.

À première vue, il semble que l’étude ait une validité interne : la température de la salle influe sur les dons. Cependant, chaque salle était de taille différente, la plus petite étant la plus chaude et la plus grande ayant une température normale.

Désormais, on ne sait pas si les dons sont affectés par la température ou par la taille de la salle, ce qui remet en question la validité interne de l’étude.

Une autre méthode d’évaluation de la validité interne consiste à utiliser des mesures de fiabilité entre évaluateurs, ce qui renforce la validité et la fiabilité de l’étude.

5. Validité externe

La validité externe concerne la capacité des résultats d’une étude à être généralisés au monde réel ou à d’autres situations. Beaucoup d’études psychologiques se déroulent dans un laboratoire universitaire, où le cadre n’est pas très réaliste. Cela pose un problème important en termes de validité externe : peut-on affirmer que ce qui se passe dans un laboratoire serait la même chose dans le monde réel ?

Prenons un exemple : une étude sur la pleine conscience implique que le chercheur attribue aléatoirement différents participants à utiliser l’une des trois applications de pleine conscience sur leurs téléphones chez eux tous les soirs pendant 3 semaines. À la fin des trois semaines, leur niveau de stress est mesuré avec un équipement EEG de pointe.

Cette étude possède une validité externe car les participants ont utilisé de véritables applications et étaient chez eux lorsqu’ils utilisaient ces applications. Les applications et le cadre à domicile sont réalistes, donc l’étude présente une validité externe.

6. Validité concomitante

La validité concomitante est une méthode d’évaluation de la validité qui consiste à comparer un nouveau test avec un test déjà existant, ou un critère déjà établi.

Par exemple, si vous élaboriez une nouvelle version d’un test de mathématiques au lycée, il faudrait la valider avant de la faire passer à des milliers d’étudiants. Ainsi, le nouveau test serait administré à un échantillon d’étudiants en mathématiques, en même temps que l’ancienne version du test.

Les scores des deux tests seraient comparés en calculant une corrélation entre eux. Plus la corrélation est élevée, plus la validité concomitante du nouveau test est forte.

7. Validité prédictive

La validité prédictive fait référence à l’association entre les scores obtenus à un test et la performance sur un critère donné. Autrement dit, le score d’une personne au test peut-il prévoir sa performance sur le critère ?

Prenons un exemple : une entreprise informatique doit embaucher des dizaines de programmeurs pour un projet à venir. Les entretiens avec des centaines de candidats seraient longs et peu précis pour identifier les codeurs compétents.

L’entreprise met donc au point un test contenant des problèmes de programmation similaires aux exigences du nouveau projet. Elle évalue la validité prédictive en faisant passer le test à ses programmeurs actuels, puis en comparant leurs scores avec leurs évaluations de performance annuelles.

Les résultats montrent que les programmeurs ayant obtenu de bonnes évaluations ont également très bien réussi le test. Ainsi, le test possède une validité prédictive.

Désormais, lorsqu’un nouvel applicant passe le test, l’entreprise peut prédire la qualité de son travail dans le futur. Les personnes qui réussissent bien au test seront vraisemblablement performantes dans le travail.

8. Validité des conclusions statistiques

La validité des conclusions statistiques concerne l’interprétation des résultats d’une étude en se basant sur les méthodes statistiques employées.

Pour évaluer cela, demandez-vous si les points suivants sont respectés :

  • Les analyses statistiques appropriées sont-elles utilisées ?
  • Les procédures d’échantillonnage sont-elles adéquates ?
  • Les outils de mesure sont-ils valides et fiables ?

Si vous répondez « oui » à ces questions, la validité des conclusions statistiques est assurée. En revanche, si la réponse à certaines ou à toutes ces questions est négative, les conclusions de l’étude sont remises en question.

Des analyses statistiques incorrectes ou des conclusions basées sur de trop petits échantillons rendent les résultats discutables. Si les résultats s’appuient sur des procédures erronées, les conclusions ne peuvent être considérées comme valides.

9. Validité de critère

La validité de critère, parfois appelée validité prédictive, fait référence à la relation entre les résultats d’un dispositif de mesure et ceux d’un domaine de performance donné (le critère).

Par exemple :

  • Dans quelle mesure un examen d’entrée d’une école prédit-il la réussite scolaire (ou étudiante) future ?
  • Dans quelle mesure les indicateurs de confiance des consommateurs sont-ils liés à l’économie ?

Un exemple de faible validité de critère est la mauvaise prédiction de la performance des athlètes lors de périodes de transferts entre les clubs de football dans les championnats européens. Les athlètes passent des dizaines de tests, pourtant la plupart de ces tests n’ont aucune relation avec la performance réelle de ces athlètes lors des matchs.

Cependant, la nutrition et l’exercice physique sont fortement liés à la longévité (le critère). Ces éléments ont une validité de critère car de nombreuses études ont montré que la nutrition et l’exercice sont directement liés à une vie plus longue et en meilleure santé.

Conclusion sur les types de validité

Il existe de nombreux types de validité car la précision des mesures des concepts abstraits est difficile à déterminer. De plus, des experts peuvent avoir des opinions divergentes sur la définition des constructions et la manière de les mesurer.

Pour ces raisons, les chercheurs en sciences sociales ont consacré beaucoup de temps à développer diverses méthodes pour évaluer la validité de leurs outils de mesure. Parfois, cela permet d’améliorer les techniques et parfois, cela révèle l’illusion de vouloir prédire l’avenir avec des procédures d’évaluation erronées.