Le conditionnement opérant est un concept en psychologie qui explique comment les personnes et les animaux développent des réponses apprises grâce à la répétition de renforcements positifs, de renforcements négatifs et de punitions.
Les animaux et les humains ajustent ainsi leurs comportements en fonction des conséquences qu’ils rencontrent, améliorant ainsi la probabilité que ces comportements se reproduisent.
Dans les situations éducatives, le conditionnement opérant peut être observé lorsqu’un enseignant récompense un élève avec des autocollants pour un bon comportement, enlève du temps de jeu à cause d’un mauvais comportement ou attribue des notes positives et négatives en fonction des résultats aux examens.
De même, dans le cas des animaux, on peut donner une friandise à un chien pour s’asseoir ou donner une décharge électrique à un animal qui touche une clôture barbelée, lui apprenant ainsi à éviter cette clôture.
Cependant, certains critiques affirment que le conditionnement opérant est déshumanisant et repose trop sur les récompenses extrinsèques plutôt que sur la motivation intrinsèque.
Exemples de conditionnement opérant
Dans cette section, voici quelques exemples de conditionnement opérant impliquant différents types de renforcement et de punition :
Renforcement positif : vous félicitez votre enfant lorsqu’il range ses jouets. Cela augmente la probabilité qu’il le fasse à nouveau.
Renforcement négatif : le réveil sonne et vous l’éteignez en vous levant. Le fait de se lever supprime le bruit désagréable et augmente la probabilité que vous vous leviez rapidement à l’avenir.
Punition positive : un chien qui aboie constamment reçoit un spray d’eau sur le museau. La surprise de l’eau diminue la probabilité qu’il aboie sans raison.
Punition négative : un adolescent rentre trop tard et perd le privilège de sortir pendant une semaine. La perte de ce privilège diminue la probabilité qu’il rentre tard à nouveau.
Renforçateurs :
- Primaires : nourriture, eau, abri
- Secondaires : argent, éloges, notes
Programmes de renforcement :
- Renforcement continu : chaque comportement désiré est systématiquement renforcé (ex : apprendre un nouveau comportement à un animal).
- Renforcement partiel : seuls certains comportements sont renforcés (ex : machines à sous dans un casino).
Voici quelques exemples de conditionnement opérant chez les animaux :
- Un rat appuie sur un levier pour recevoir des croquettes lorsqu’une lumière verte est allumée, mais reçoit un choc léger lorsqu’une lumière rouge est allumée.
- Un pigeon est récompensé avec de la nourriture lorsqu’il picore un disque de couleur spécifique, ce qui augmente la probabilité qu’il picore ce disque à l’avenir.
- Un chien apprend à s’asseoir à la commande en recevant une friandise chaque fois qu’il s’assoit correctement.
1. Entraînement des animaux
L’apprentissage opérant est souvent utilisé pour entraîner les animaux. Que ce soit votre chien domestique ou un animal sauvage domestiqué utilisé dans un film, la méthode est essentielle pour obtenir les comportements souhaités.
Par exemple, si vous voulez apprendre à votre chien à se coucher et se rouler, vous utiliserez une technique appelée modelage. Comme il est peu probable que le chien se couche et se roule dès la première fois que vous donnez l’ordre, vous récompensez des approximations de plus en plus proches du comportement souhaité.
D’abord, récompensez le chien lorsqu’il se couche. Ensuite, récompensez-le lorsqu’il se couche sur un côté de son corps. Après, récompensez le chien lorsqu’il se couche d’un côté et se retourne sur le dos. Finalement, récompensez le chien lorsqu’il se couche et effectue un roulement complet.
- Comportement souhaité : assis, couché, rapporter
- Récompense ou Punition : friandises
L’utilisation de signes et de récompenses adaptés permet d’obtenir les résultats souhaités et de réussir l’entraînement de l’animal.
2. Les contraventions pour excès de vitesse
Comportement souhaité : conduire lentement
Récompense ou punition : contravention pour excès de vitesse
On ne sait pas vraiment si les contraventions pour excès de vitesse ont été inventées sur la base du conditionnement opérant. Cependant, une amende élevée pour avoir dépassé la limite de vitesse est certainement une punition.
Les contraventions pour excès de vitesse dissuadent-elles de rouler trop vite par la suite ? C’est une question intéressante, mais malheureusement, elle n’a pas été suffisamment étudiée. Au moins une étude d’un an dans le Maryland a révélé des résultats surprenants.
Dans cette étude, plus de trois millions de conducteurs titulaires d’un permis ont été analysés. Les conducteurs ayant reçu une contravention en mai 2002 ont été comparés à ceux qui n’en ont pas reçu. La grande question est : les conducteurs ayant reçu une contravention étaient-ils moins susceptibles d’en recevoir une seconde au cours de l’année suivante ?
Les résultats ont montré que les conducteurs ayant reçu une contravention étaient deux fois plus susceptibles d’en recevoir une seconde par rapport aux conducteurs n’ayant pas reçu de contravention. Bien que les résultats semblent clairs, il s’agit d’une question complexe et nous devons prendre ces résultats avec prudence jusqu’à ce que davantage de recherches soient menées.
3. Crises de colère
Comportement souhaité : l’enfant arrête de pleurer lorsqu’il reçoit la nourriture
Récompense ou punition : bonbons
Les « terribles deux ans » peuvent être très difficiles pour les parents. Prenons l’exemple d’un enfant capricieux qui fait une crise à l’heure du dîner lorsqu’il y a des haricots verts dans son assiette. Afin de calmer l’enfant, la mère retire les haricots verts et lui donne une portion supplémentaire de dessert.
Dans le cadre du conditionnement opérant, l’enfant utilise le renforcement négatif. Lorsque la mère donne un dessert, l’enfant cesse de pleurer. Un comportement est renforcé (donner un dessert) en supprimant un stimulus désagréable (arrêter les pleurs). Ainsi, la probabilité que la mère donne un dessert à l’avenir augmente.
Évidemment, il est peu probable qu’un enfant de deux ans ait lu les dernières recherches sur le renforcement négatif, mais il ne faut pas sous-estimer l’intuition des enfants.
4. Étoiles dorées et visages souriants
Dans les écoles maternelles et primaires, les enseignants utilisent quotidiennement les principes de conditionnement opérant. Lorsqu’un enfant se comporte bien, ou du moins ne fait pas de bêtises, l’enseignant peut coller une étoile dorée ou un autocollant de visage souriant à côté de son nom sur une affiche.
Recevoir une étoile dorée est très important pour un enfant de 5 ans. L’enseignant vient d’utiliser le renforcement positif pour récompenser un comportement qu’il souhaite voir se reproduire. Récompenser un comportement augmente la probabilité qu’il se répète.
De nombreux éléments peuvent servir de renforçateur positif pour un enfant de 5 ans : autocollants, « high-five » et même simplement un sourire chaleureux.
5. Colliers électriques
Le comportement souhaité est d’arrêter d’aboyer et la récompense ou punition est un choc lorsque le chien aboie. Un collier électrique peut être utilisé pour dresser un animal domestique, généralement un chien, pour l’empêcher d’aboyer ou de quitter le jardin. Le collier fonctionne en détectant automatiquement un aboiement ou lorsque le chien dépasse une certaine limite, déclenchant alors un choc électrique.
Cela peut sembler cruel, mais l’intensité du choc peut être contrôlée par le propriétaire, et la plupart des colliers offrent différents réglages à choisir. La plupart des chiens apprennent rapidement, ils n’auront donc pas à subir de chocs pendant une longue période.
Les colliers électriques sont un exemple simple de punition dans le conditionnement opérant. En appliquant un stimulus aversif après un comportement spécifique, la fréquence de ce comportement diminue.
6. Plans de mise à niveau de service
Comportement souhaité : payer un supplément
Renforcement ou punition : moins de publicités
De nos jours, regarder des vidéos courtes, des séries télévisées ou des films est plus facile que jamais. Cependant, les interruptions publicitaires peuvent être particulièrement ennuyeuses. Avant les services de diffusion en continu, les publicités faisaient partie intégrante du visionnage, et il était impossible de les éviter.
Aujourd’hui, la plupart des entreprises de médias proposent à leurs clients un plan de mise à niveau payant pour supprimer les annonces publicitaires. Moyennant un faible coût supplémentaire, un client peut ainsi profiter de contenus sans interruption. Cette technique est très prisée parmi les plus grandes plateformes médiatiques actuelles.
Cela constitue un exemple de renforcement négatif. En éliminant un stimulus désagréable (les publicités), les plateformes médiatiques encouragent un comportement souhaité chez le client (payer un supplément). Cette stratégie est extrêmement efficace.
7. Les jeux vidéo
Comportement souhaité : accomplissement des tâches en jeu
Récompense ou Punition : points et récompenses en jeu
Les jeux vidéo sont un exemple intensif de l’application du conditionnement opérant. Les concepteurs de jeux utilisent habilement les récompenses et les punitions pour façonner le comportement des joueurs.
Par exemple, en accomplissant certaines tâches, le joueur reçoit des éléments utiles qui l’aideront à progresser dans le jeu, tels que des pièces spéciales ou plus d’énergie pour le personnage.
Ces récompenses sont de puissants incitatifs et poussent le joueur à passer plus de temps à jouer. Bien que cela puisse être une situation souhaitable du point de vue du joueur, cela fait également partie de l’équation qui conduit à la dépendance aux jeux.
De nombreuses personnes deviennent tellement accros aux jeux vidéo qu’elles y passent toute la journée. Certains éviteront même de faire des pauses pour ne pas interrompre leur partie, ce qui peut malheureusement causer des problèmes sérieux pour de nombreuses familles et pour la société en général.
8. Pause éducative
En tant que parents et enseignants, la technique de la pause éducative peut être utilisée lorsqu’un enfant se comporte mal. Il s’agit de retirer l’enfant de la situation où il adopte un mauvais comportement et de le faire s’asseoir ailleurs.
Du point de vue de l’enfant, la pause éducative est une punition. Il est éloigné de son aire de jeu et doit rester assis tranquillement, ce qui peut être ennuyeux pour un jeune enfant.
Selon le principe du conditionnement opérant, la punition intervient après un comportement indésirable, ce qui est censé réduire la probabilité de répétition de ce comportement.
La pause éducative a parfois été mal comprise au fil des années. Beaucoup de responsables l’utilisent uniquement comme punition. Cependant, elle doit aussi servir de moment pour que l’enfant puisse se calmer et réfléchir à ses actes. Ce processus de réflexion devrait être guidé par le responsable afin que l’enfant comprenne pleinement les conséquences de son comportement et apprenne à éviter la pause éducative à l’avenir.
9. Rappels incessants
Comportement souhaité : accomplir une tâche
Récompense ou punition : rappels continus jusqu’à ce que la tâche soit terminée
Imaginez ce scénario classique dans une famille avec des adolescents : après le dîner, les parents doivent souvent insister pour que leurs deux adolescents les aident à faire la vaisselle. Ils leur font des reproches et évoquent des notions de responsabilité, d’appartenance à une famille, de maturité et de refus de se comporter comme des enfants gâtés.
Ces rappels incessants sont très désagréables et les enfants se sentent exaspérés lorsqu’ils se produisent. Afin d’éviter d’être ainsi harcelés, ils finissent par faire la vaisselle.
Ceci est un bon exemple de renforcement négatif. En retirant un stimulus aversif (les rappels des parents), un comportement spécifique est augmenté (laver la vaisselle).
10. Programmes de récompenses de cartes de crédit
Comportement souhaité : utiliser la carte de crédit
Récompense ou punition : remises en argent ou points de récompense
Les cartes de crédit gagnent de l’argent de diverses manières. L’un des moyens principaux est de facturer aux commerçants des frais pour chaque transaction d’achat. Ainsi, les sociétés de cartes de crédit souhaitent que les gens utilisent le plus possible leur carte.
Pour cela, elles proposent des programmes de récompenses aux clients. Cela peut se présenter sous la forme de remises en argent sur les achats ou de l’accumulation de points pouvant être utilisés ultérieurement. Comme le suggère le nom de ces programmes, ils utilisent le conditionnement opérant.
En récompensant le client à chaque utilisation de la carte, il sera plus enclin à l’utiliser de nouveau.
11. Primes salariales
Comportement souhaité : dépasser les indicateurs clés de performance
Récompense ou punition : salaire supplémentaire
Pour beaucoup de personnes, rien ne motive plus que l’argent. C’est précisément pour cette raison que de nombreuses entreprises proposent des primes de fin d’année. Dans certaines professions, comme les gestionnaires de hedge funds et les courtiers en valeurs mobilières, cela peut représenter une somme d’argent considérable. Pour le PDG d’une grande entreprise, une prime de fin d’année peut atteindre plusieurs millions.
Il est facile de voir l’application du conditionnement opérant ici. Il s’agit d’un cas simple de renforcement positif pour un comportement souhaité.
D’un point de vue théorique, plus la récompense suit rapidement le comportement, mieux c’est. Pour cette raison, les vendeurs travaillent souvent à la commission, ce qui permet de fournir un renforcement positif plus fréquemment.
12. Les applaudissements
En français, le texte se lit comme suit :
Comportement souhaité : une bonne performance
Récompense ou punition : gratification sociale
Beaucoup de personnes se sont essayées au théâtre ou à la musique. Que ce soit lors d’une production scolaire ou d’un spectacle avec une troupe de théâtre locale, l’expérience peut être stressante, que vous soyez amateur ou professionnel.
Rien n’est plus gratifiant que de recevoir des applaudissements après une performance réussie. À l’inverse, rien n’est plus humiliant que le silence glacé d’un public insatisfait. L’expérience peut être très enrichissante ou être un véritable désastre.
Le conditionnement opérant nous montre que les applaudissements peuvent augmenter les chances que nous nous représentions à nouveau. Ainsi, si c’est la première fois qu’une personne participe à une production en direct, comme une pièce de théâtre ou un récital, si le public la récompense avec des applaudissements, il y aura très certainement une deuxième représentation.
13. Employé du mois
Comportement souhaité : dépasser les attentes au travail
Récompense ou sanction : prix, plaque ou carte-cadeau
Tout le monde apprécie être reconnu pour son bon travail et recevoir une distinction. De nombreuses entreprises proposent diverses récompenses pour les employés en première ligne, dont l’Employé du mois. Cela peut inclure un certificat et éventuellement le nom de la personne gravé sur une plaque visible par tous.
Le raisonnement de base derrière ces distinctions est simple : les récompenses renforcent le comportement. Donc, si vous souhaitez que vos employés fassent du bon travail, offrez un prix à ceux qui se démarquent. Non seulement cela incitera l’employé à travailler plus dur, mais cela influencera également le comportement des autres employés.
Ceci est un exemple de conditionnement opérant appliqué dans un contexte professionnel. Ce n’est qu’un exemple parmi tant d’autres. Les départements des ressources humaines utilisent fréquemment les principes du conditionnement opérant pour motiver le personnel à travailler plus dur et être plus productif.
Définition du conditionnement opérant
L’être humain et les animaux apprennent de manière similaire. Lorsqu’un animal effectue une action menant à la découverte de nourriture, il répétera cette action. Les humains agissent de la même manière : si une action est récompensée, nous avons tendance à la répéter, et vice versa si elle est punie.
Ce procédé d’apprentissage découle de la Loi de l’Effet, formulée pour la première fois par le psychologue Edward Thorndike à la fin du 19ème siècle.
Plus tard, la théorie de Thorndike fut affinée par B.F. Skinner et prit le nom de conditionnement opérant. Ce type de conditionnement se compose de :
- Renforcement positif
- Renforcement négatif
- Punition
Le renforcement positif survient lorsqu’une récompense est donnée après un comportement spécifique. Le but est d’augmenter la fréquence de ce comportement, car la récompense est très efficace pour encourager sa répétition.
Le renforcement négatif consiste à retirer un élément désagréable. L’objectif est d’augmenter un comportement spécifique en supprimant quelque chose de négatif. Il est également efficace pour rendre plus probable la répétition d’une action.
La punition consiste à appliquer une conséquence aversive après un comportement spécifique. Le but est de diminuer la fréquence de ce comportement. Bien que la punition soit considérée comme efficace, elle présente divers effets secondaires qui rendent son utilisation plus complexe.
En résumé, le conditionnement opérant, parfois appelé conditionnement instrumental, est un processus d’apprentissage impliquant des récompenses et des punitions pour influencer un comportement.
Conditionnement opérant et le conditionnement classique
Le conditionnement opérant et le conditionnement classique sont les deux types de conditionnement comportemental dans la théorie behavioriste de l’éducation.
Le conditionnement opérant consiste en un apprentissage par répétition, récompense et punition. En utilisant cette méthode, vous cherchez explicitement à modifier votre comportement conscient.
Par contre, le conditionnement classique, implique une association subconsciente ou involontaire entre un stimulus et une réponse (aussi connu sous le nom d’apprentissage associatif ou réponse pavlovienne).
Par exemple, saliver lorsqu’il y a une odeur de nourriture appétissante est un exemple de conditionnement classique, car il se produit au niveau subconscient.
Le conditionnement classique inclut des termes tels que réponse inconditionnelle et stimulus inconditionnel. On les appelle «inconditionnés» car ils ne sont pas choisis ou explicitement sélectionnés comme mécanismes d’enseignement.
Au lieu de cela, la réponse est une réaction naturelle et subconsciente à quelque chose dans l’environnement. Vous trouverez ci-dessous un bref récapitulatif des différences entre les deux types de conditionnement:
Conditionnement opérant | Conditionnement classique |
Apprentissage conscient | Apprentissage subconscient |
Repose sur répétition, récompense et punition | Repose sur l’association entre stimulus et réponse |
Modification du comportement volontaire | Réaction naturelle et subconsciente |
En résumé, le conditionnement opérant et le conditionnement classique sont deux méthodes d’apprentissage comportemental qui diffèrent par la façon dont elles modifient le comportement, l’un étant conscient et l’autre subconscient.
Concepts liés
Boîte de Skinner
La boîte de Skinner, également appelée chambre de conditionnement opérant, est un dispositif expérimental inventé par B.F. Skinner pour étudier le comportement animal. Il s’agit d’un espace clos où un animal, souvent un rat ou un pigeon, effectue une action spécifique, comme appuyer sur un levier, pour recevoir une récompense (renforcement primaire) ou éviter une punition.
Renforcements et extinction
Dans le conditionnement opérant, les renforcements sont utilisés pour augmenter la fréquence d’un comportement. Il existe deux types de renforcements : primaires (tels que la nourriture) et secondaires (tels que les éloges).
L’extinction se produit lorsque le renforcement cesse, ce qui entraîne une diminution de la fréquence du comportement.
Programmation des renforcements
Les renforcements peuvent être fournis selon diverses programmations :
- Renforcement continu : la réponse est renforcée à chaque occurrence.
- Programmation à intervalle fixe : renforcement après un intervalle de temps fixe.
- Programmation à intervalle variable : renforcement après un intervalle de temps variable.
- Programmation à rapport fixe : renforcement après un nombre fixe de réponses.
- Programmation à rapport variable : renforcement après un nombre variable de réponses.
Loi de l’effet et Thorndike
Edward Thorndike a proposé la loi de l’effet, selon laquelle les comportements suivis de conséquences agréables sont renforcés et augmentent en fréquence, tandis que les comportements suivis de conséquences désagréables sont affaiblis et diminuent en fréquence.
Généralisation et discrimination
- Généralisation de la réponse : réagir de manière similaire à un stimulus similaire.
- Généralisation du stimulus : réponse identique à plusieurs stimuli liés.
- Discrimination du stimulus : capacité à distinguer entre différents stimuli et répondre de manière appropriée.
Conditionnement vicariant et répondant
Le conditionnement vicariant se produit lorsque l’on apprend en observant le conditionnement d’autrui. Le conditionnement répondant est un autre terme pour décrire le processus de conditionnement d’une réponse à un stimulus.
Conclusion
Comme nous l’avons constaté, le conditionnement opérant a de nombreuses applications. Il est couramment utilisé dans les salles de classe par les enseignants et à la maison par les parents. Bien sûr, il n’est pas efficace à 100%, mais en général, cela fonctionne plutôt bien.
Le conditionnement opérant est également largement utilisé dans les entreprises. Parfois, il est utilisé pour inciter les clients à dépenser plus d’argent ou pour augmenter la productivité des employés.
Les animaux sont généralement formés par le conditionnement opérant. La plupart d’entre eux peuvent être appris à obéir à certaines commandes et même à réaliser des tours. Même l’industrie du cinéma l’utilise pour former les animaux à effectuer des actions spécifiques pour un film.
En appliquant des récompenses ou des punitions, ou en supprimant quelque chose de désagréable, on peut façonner le comportement de nombreuses créatures vivantes, y compris vous et moi.