dimanche 28 février 2016

À la découverte du clicker training



Dans le cadre de mon cours de comportement avec l’université de Guelph, j’ai dû expérimenter le clicker training comme travail de recherche. J’utilise déjà abondamment le clicker dans l’entrainement de mon chien, mais très peu avec ma jument. J’ai toujours préféré utiliser la voie et le mot « ouiiiii » comme renforcement secondaire (on y reviendra plus tard). Bien que cette technique fonctionne très bien aussi, il faut tout de
en plein bavardage avec ma jument
très probablement un OUIIII :)
même s’assurer que le mot est toujours utilisé et dit sur la même intonation. Le clicker apporte une précision de plus pour indiquer au cheval le moment précis où il a effectué le bon comportement. Bref, je devais enseigner un tour à mon cheval et détailler mon expérimentation. Pour ce faire, je devais commencer par trouver un petit tour sympa, qu’elle ne connaissait pas déjà… En lisant dans mes livres, je suis tombée souvent sur "enseigner au cheval à mettre son nez dans un licol". Ouais, c’est sympa et utile, voilà ce que je vais enseigner. Mentalement j’ai établi un protocole d’étape à suivre avec ma jument, à la vitesse requise pour sa personnalité. Comme c’est une jument nerveuse, j’ai préféré prendre le temps de bien la rendre à l’aise à travers les étapes. Ensuite est venu le moment d’expérimenter la technique et d’observer les résultats. Puis il fallait mettre le tout dans mon papier. Beaucoup plus facile à dire qu’à faire, par chance une amie m’a grandement aidée à établir une façon logique de l’écrire, car le côté rédaction scientifique ne me vient pas encore naturellement! Alors voilà quel était le but de cet essai.

heureuse de sa récompense

Pour ceux qui ne connaisse pas encore le clicker, c’est un petit outil bien intéressant : une petite boite de plastique munie d’un bouton qu’on enfonce et qui produit toujours le même son. De cette façon, le signal est toujours le même pour le cheval, il ne peut être confondu. Le principe est assez simple, le clicker est un renforcement secondaire, c'est-à-dire que ce n’est pas lui qui renforce le comportement en tant que tel, il est simplement là pour indiquer que le renforcement arrivera d’une minute à l’autre. Le renforcement primaire c’est la récompense utilisée par la suite : carotte, pomme, gratouille, pause, etc. Pourquoi ne pas simplement utiliser le renforcement primaire alors? Parce que la fenêtre dans laquelle le cheval peut associer un comportement avec la récompense est très petite, 0,5 seconde pour être précis. Donc, si la main n’est pas à proximité de la bouche, l’association sera beaucoup plus lente, voire nulle. Le renfoncement secondaire sert donc à agrandir cette fenêtre. Lorsqu’on clique, l’indication que le comportement était le bon est donnée dans les 0,5 seconde requises pour l’assimilation et la récompense arrive tout de suite après. Voilà pourquoi le clicker est un outil bien pratique lors de l’apprentissage.

Une récompense que ma jument adore
une pause + brouter de l'herbe = parfait

Il faut aussi savoir que pour qu’un comportement soit acquis ou modifier il faut que le renforcement soit suffisamment motivant pour le cheval. Je m’explique, ne pensez pas qu’un cheval fait les choses pour nous faire plaisir, nous ne sommes pas si incroyables que cela… Si le cheval nous « aime » (on pourrait dire apprécier, on ne sait pas à quelle mesure l’amour existe dans le monde animal), c’est en partie parce qu’on lui sert à quelque chose : on le nourrit, on le soigne, on le sécurise, on en prend grand soin quoi… Mais pour qu’il ait envie de travailler, il faudrait qu’on trouve le meilleur moyen de le motiver, notre seule personne n’est pas vraiment suffisante. Certains motivent par la peur, le cheval obéira par peur de se faire réprimander, certains motivent par le positif (nourriture, pause, gratouille…) le cheval obéira par l’envie d’avoir cette récompense. Le cheval est une récréation et un bonheur pour nous et il faut devenir une récréation et du plaisir pour lui aussi! De cette façon, il aura envie d’apprendre et de travailler avec nous, car il en tirera quelque chose lui aussi. La motivation doit être extra payante, surtout si vous souhaitez changer un « mauvais » comportement. Jacinthe Bouchard dit que si le comportement à une grande valeur pour l’animal, la récompense qu’on offrira pour le comportement de remplacement devra être encore plus payante pour lui… Logique, mais on n’y pense pas toujours!
Une jument intéressée, volontaire, motivé
Et si il y avait quelque chose à gagner?

Des études ont démontré que le cheval apprend mieux lorsqu’il est travaillé avec du renforcement positif. Pourquoi? Parce qu’un cheval qui est travaillé dans la peur et la punition n’essayera pas de trouver la réponse de peur de donner la mauvaise et d’être puni. Un cheval travaillé de façon plus positive essayera d’ambler de trouver la réponse et du même fait, d’atteindre la récompense qu’il aura pour la bonne réponse. Je ne dis pas ici qu’il ne faut pas utiliser de renforcement négatif, au contraire, bien que le nom indique "négatif", ce n’est pas une mauvaise chose. Le renforcement négatif signifie seulement qu’on retire quelque chose lorsque le bon comportement voulu est offert (on retire souvent un stimulus désagréable sans pour autant être nocif pour le cheval), le renforcement positif quant à lui signifie qu’on ajoute quelque chose lorsque le cheval donne la bonne réponse (récompense, pause, gratouille…). Le renforcement positif ne peut être effectué pour absolument tout, parfois on a besoin d’un peu de négatif aussi et on peut les mélanger! Par exemple, on conduit le cheval en selle avec le renforcement négatif, sinon comment lui indiquer qu’on veut qu’il aille à gauche ou qu’il désengage ses postérieurs, une petite pression suffit, mais c’est une pression et c’est un renforcement négatif, mais lorsque le cheval fait bien on peut récompenser ensuite… Et donc mixer les deux types de renforcement. Ce qui aura pour effet d’avoir un cheval de plus en plus sensible et de plus en plus motivé! Le dosage voila ce qui fait le bon travail, le juste équilibre entre positif et négatif!
La demande est effectué par renforcement négatif (la badine simplement sur l'arrière des genoux)
La décompense => retirer la badine (renfo négatif) + ajouter une carotte (renfo positif)

Avec tout cela en tête, tous ces principes, j’ai essayé la technique avec ma jument. Mes 4 étapes étaient les suivantes :

1-Comprendre que le licol est l’objet clé
Au début, le cheval n’a aucune idée de ce qu’on attend de lui et donc pour lui faire comprendre que tout était à propos du licol, dès que ma jument passait sa tête près du licol je cliquais. Elle a vite compris que c’était le licol qui apportait les récompenses
2-     Toucher le licol
Pour consolider le fait que le licol est la clé, je ne récompensais que lorsqu’elle touchait au licol. J’ai souvent utilisé cette technique et donc ma jument à rapidement compris.
3-     Passer son nez dans les montants
Le nez d’un cheval est un outil précieux… Il ne le met donc pas n’importe où. Pour passer de façon progressive entre toucher le licol et mettre son nez entièrement dans la muserolle, j’ai préféré ajouter cette étape.
4-     Mettre le nez dans la muserolle
Pour cette option j’allais lui laisser la chance d’explorer vers la muserolle, mais si elle mettait trop de temps à comprendre le but, j’allais simplement placer un bout de carotte sous la muserolle et lui donner lorsqu’elle passerait son nez dedans!

L’expérimentation a bien fonctionné et nous avons eu des séances de 5 minutes sans plus! C’était assez rapide et les progrès étaient assez faciles à voir, ce qui était plutôt encourageant. J’ai dû utiliser la carotte pour attirer son nez dans la muserolle et j’ai fait l’erreur de ne pas répéter cette étape. Pour toutes les autres étapes, j’ai attendu qu’elle le fasse plusieurs fois et que je sente que l’étape soit bien acquise avant de passer à autre chose, mais pas pour la dernière. Je lui faisais passer le nez, puis je terminais là-dessus… alors cette étape était plus longue à acquérir. Maintenant, je la répète plus d’une fois pour une meilleure assimilation! Le travail est toujours en cours, j’aimerais arriver au point où je présente le licol et elle y met son nez direct, mais ça demande du temps et on continue de le travailler!
question et réponse
Expression positive, elle sait que cette manœuvre est toujours récompensée

Ce que j’ai bien aimé avec cet essai c’est la progression qui me donnait l’impression d’être sous forme de jeu. Je lui présentais la « question » et j’attendais qu’elle trouve la réponse. De cette façon, j’ai senti que ma jument avait le choix et qu’elle pouvait donc s’impliquer beaucoup plus dans le processus d’apprentissage, que je lui laissais de la latitude sur la vitesse d’apprentissage surtout. Comme elle est nerveuse, je ne dois pas sauter d’étape, en étant impliquée dans cette séance, elle pouvait clairement indiquer lorsqu’elle était plus à l’aise. J’ai aussi trouvé que ma jument était plus impliquée, je la voyais se questionner et réfléchir… Les chevaux apprennent à apprendre et cette technique leur permet de le faire. On leur demande de réfléchir et donc d’apprendre à résoudre des problèmes. J’ai aimé que ma jument soit plus détendue et qu’elle essaie vraiment, avec une expression positive, de comprendre la question, car la motivation était intéressante et elle voulait vraiment avoir cette carotte hihi! Bien entendu, je me demande comment je pourrais utiliser cet outil efficacement en selle! Car pour l’apprentissage de mouvement précis, il serait en effet très utile, mais entre tenir les rênes, être concentré sur les aides,  tenir le clicker dans ses mains et surtout cliquer au bon moment va demander beaucoup d’apprentissages, je vais donc continuer mes essais pour voir ce que ça donnera en selle! Pour le moment, j’ai recommencé à utiliser ma voix beaucoup plus en selle, mais j’ai envie d’essayer le clicker, car je trouve ça très intéressant. Bien entendu, je sais que le renforcement négatif doit aussi être utilisé et je ne le dédaigne pas du tout, car c’est aussi un formidable outil. Je crois que les deux types de renforcement se complètent à merveille et qu’il serait utile de les intégrer tous les deux à nos séances de travail. Tout est une question d’équilibre!