fbpx

Ignorer jusqu’au bout

 

La technique qui vise à retirer le renforcement d’un comportement préalablement renforcé s’appelle l’extinction. 

 

On l’utilise, par exemple, lorsque le chien fait un comportement dérangeant dans le but d’avoir notre attention. Dans ce cas-là, le fait d’ignorer le chien n’a pas pour but de le laisser faire ce qu’il veut sans intervenir, mais bon de s’assurer que le comportement ne reçoive pas de récompense, c’est-à-dire votre attention. 

 

Ignorer un chien est en théorie facile. En pratique, c’est très difficile. La règle d’or, lorsqu’on ignore son chien, est de l’ignorer jusqu’au bout. L’animal va augmenter en intensité et tenter d’avoir ce qu’il obtenait précédemment. C’est normal. Mais il est important de ne pas céder. Sinon, vous risquez de renforcer une version exagérée du comportement tout en développant de la résistance à l’extinction. 

 

Dans l’article sur la résistance à l’extinction, on s’était laissé en discutant du fait que le chien cherchait des indices qu’il était sur la bonne voie pour obtenir une réaction. En entraînement, on peut utiliser ceci pour instaurer ce qu’on appelle marqueur ou un « keep going signal ». Lorsqu’on tente d’éteindre un comportement, par contre, ces micro-réactions sont notre pire ennemi.  

 

Qu’est-ce qu’un renforcement secondaire?

 

Un problème peu souvent abordé lorsqu’on utilise l’extinction est les renforcements secondaires. 

 

Un renforcement secondaire, grosso modo, c’est quand le chien associe quelque chose à la possibilité de récompense. 

 

Un exemple classique est le cliqueur. Le clique qu’émet la languette de métal est neutre. En elle-même, elle ne veut rien dire. Lorsque le chien reçoit de la nourriture après l’avoir entendu, il en vient à associé ce son à des bonnes choses. Le cliqueur est ensuite utilisé pour marquer les bons comportements en entraînement et indiquer que la récompense s’en vient. Le clique est un exemple de renforcement secondaire. C’est pour ça que c’est efficace. Dans ce cas-ci, le renforcement secondaire est utilisé volontairement afin de clarifier nos entraînements et d’obtenir des résultats plus rapidement. C’est ça super. 

 

Des fois, par contre, ce ne l’est pas du tout. Parfois, même, ça joue contre nous. 

 

Les renforcements secondaires – Quand toutes vos réactions deviennent payantes

 

Les animaux, comme les humains, sont toujours à la recherche de signes qui indiquent qu’ils sont sur la bonne voie. En langage d’entraîneurs, ces signes deviennent des renforcements secondaires. 

 

Les renforcements secondaire sont les pires ennemis de l’extinction. 

 

Le problème quand on tente d’ignorer un comportement, est que le chien cherche une indication que nous sommes sur le point de lui donner ce qu’il veut. Il cherche des signes que ce qu’il fait fonctionne. 

 

Il est 16h. Votre chien a faim. Il commence donc à chigner. Vous vous dites « Si je me lève, je vais renforcer son comportement! » C’est simple, vous allez l’ignorer. Vous vous tenez donc sur votre chaise, déterminé à rester assis. C’est simple, au fond, vous n’avez qu’à ne pas nourrir votre chien, non? Non? Sauf que vers 16h30, vous allez avoir envie d’aller à la toilette. Qu’allez-vous faire? Vous allez vous levez. Dans sa tête, votre chien se dit « VICTOIRE! » Il a réussi à avoir une réaction. 

 

« Euh… Mais j’ai juste été faire pipi, je ne l’ai pas nourrit! Ça ne fonctionne pas ton affaire. »

 

Le fait que vous ne le nourrissez pas, mais que vous allez simplement vous soulager, n’est pas important ici. Votre chien persiste (car il est devenu hyper résistant à l’extinction) et cherche n’importe quel indice qu’il est sur la bonne voie. En vous levant pour aller à la toilette, vous avez renforcé votre chien avec un renforcement secondaire. Hey, il n’a pas peut-être pas eu ce qu’il voulait, mais il a eu quelque chose! Alors autant continuez. Qui sait… vous allez peut-être céder. 

 

Ce n’est pas vous qui décidé ce qui est un renforcement secondaire, c’est l’apprenant. 

 

Quand j’étais au Chicken Camp, nous entraînions des poules au cliqueur à frapper une cible avec leur bec. Comme on a dit plus haut, le clique est censé être le prédicteur de la récompense. L’oiseau de ma partenaire, Dyno-Mite, ne voulait pas produire le comportement et ne faisait que la regarder tout en se penchant vers la cible. La professeure a vite compris ce qui se passait. Dyno ne voulait pas lâcher ma partenaire des yeux, ce qui l’empêchait de tapper sa cible. Elle cherchait un repère visuel qui était devenu le renforcement secondaire, c’est-à-dire le prédicteur que la récompense s’en venait, plutôt que le son du clique. 

 

En observant attentivement ce que ma partenaire faisait, je me suis rendue compte qu’elle remuait son pouce lorsqu’elle s’apprêtait à cliquer. Dyno avait associé la jointure qui remue à la nourriture qui s’en vient. Dyno reproduisait donc le comportement (se pencher vers la cible sans la taper) qui faisait que son entraîneuse remuait son pouce. De son côté, ma partenaire remuait son puce car en se préparait à cliquer un oiseau qui tappe la cible. Sitôt le problème corrigé, Dyno s’est mise à taper la cible. Le fait de remuer le pouce était un parasite en entraînement car la poule l’avait identifié comme renforcement secondaire. 

 

Le problème, avec l’extinction, c’est que la résistance produit un chien qui non seulement va continué malgré la diminution du renforcement, mais qui aussi va devenir un champion à trouver des renforcements secondaires. 

 

Les renforcements secondaires et le sommet d’extinction

 

Prenons l’exemple d’un chien qui mordille pour avoir votre attention. Je ne parle pas ici d’un chiot, mais d’adulte. J’ai surtout vu cette situation le plus souvent chez les propriétaires de labrador, car ce sont des chiens très « buccaux ». Le chien apprend que, s’il vous mordille, parce que ça fait mal, vous allez finir par réagir. Les gens aux prises avec ce problème se font suggérer d’ignorer le chien. Se disant qu’ils n’ont rien à perdre, ils essaient. Sauf que, un chien qui mordille, ça fait mal! Un chien en sommet d’extinction qui mordille, ça fait encore PLUS mal. Demander à ces gens de ne pas réagir est leur demander de faire un effort surhumain face à un comportement qui non seulement est intense, douloureux, mais en plus légèrement auto-renforçant. La personne retire donc sa main. 

 

Et bam! Vous avez votre renforcement secondaire! 

 

Vous venez de renforcer non seulement le comportement, mais le fait de mordiller encore plus fort! 

 

Mon ami avait une chatte qui avait l’habitude de manger vers sept heures le matin. Le problème, c’est que sa minette le réveillait vers 6h chaque matin en miaulant. Rapidement, elle s’est mise à commencer son numéro de chat affamé de plus en plus tôt. Si vous avez déjà eu des chats, vous savez exactement de quoi je parle. Mon ami en a eu assez. Après quelques lectures sur Internet, il s’est dit qu’il allait essayer l’extinction. Il a été avisé que la chatte augmenterait en intensité et qu’il devrait l’ignorer jusqu’au bout. « Ok pas de trouble. Je suis capable de faire le mort le matin. » 

 

Le matin suivant, la chatte, comme de raison, saute dans le lit en faisant « prouuuu » vers 5h du matin. Mon ami reste couché en fermant ses yeux le plus fort possible. La chatte miaule et tourne autour de lui. Mon ami continue son imitation de l’homme le plus assoupi sur la planète. La chatte se met à ronronner en lui faisant des pattes et mon amie fronce les sourcils. La chatte se met à crier de plus belles et fait son numéro de chat qui n’a jamais mangé de toute sa vie. Mon ami se tourne dans son lit, la face dans l’oreiller, pour ne pas entendre la minette.  

 

Que s’est-il passé? Chaque fois que la chatte a produit un comportement et augmenté en intensité, mon ami a eu une réaction. Il a fermé les yeux forts, a froncé les sourcils et s’est retourné. À chaque fois, il a renforcé le comportement durant le sommet d’extinct. Même si la chatte n’a pas eu ce qu’elle voulait, elle a obtenu plein d’indices que, plus elle exagérait dans sa quête pour faire se lever son humain et plus elle avait de réaction de sa part. 

 

Non seulement les renforcements secondaires ont récompensé le comportement, mais comme ils ont été fait durant un sommet d’extinction, c’est une version augmenté qui a été sélectionnée. Comme avec le chien qui mordille de plus en plus fort. Après tout, si pétrir avec les pattes a suffit à faire froncer les sourcils de l’humain-qui-fait-semblant-de-dormir-mais-soyons-honnête-je-suis-un-chat-perspicace-je-sais-très-bien-que-tu-ne-dormais-pas, pourquoi ne pas essayer de planter les griffes ou, encore, de faire tomber le verre d’eau sur la table de nuit. Ça, c’est sûr, ça va le faire réagir! Et, comme de fait, la chatte continue tellement son cirque pendant longtemps car elle est devenue résistante à l’extinction grâce à tous les renforcements secondaires que le cadran sonne, il est 7 heure et il est temps de donner à manger au mausus de minou. 

 

Ignorer jusqu’au bout… et les renforcements secondaires

 

La règle d’or, lorsqu’on ignore, est d’ignorer jusqu’au bout. On l’a dit. Le but de cette règle est de ne pas créer de résistance à l’extinction ni d’augmenter le comportement en sommet d’extinction. 

 

Le problème, c’est que les renforcements secondaires vont venir compliquer la chose. Plus vous allez tenter d’ignorer et vous allez capituler et plus votre chien identifiera de renforcements secondaires. Vous en viendrez à un point ou le simple fait de remuer sera perçu comme indice que la réussite est proche. 

 

Quand est-il des comportements qui sont impossible à ignorer?

 

Comment ignorer efficacement sans créer une tonne de renforcement secondaire? 

 

Ignorer est-il voué à l’échec? 

 

La suite, la semaine prochaine