Qu'est-ce qu'une récompense pertinente et comment la choisir ?

Qu'est-ce qu'une récompense pertinente ?

(et comment la choisir)

Pour fonctionner, amener un réel progrès, la récompense doit être réellement attrayante aux yeux du chien. Je parle souvent de niveau d’appétence à adapter au contexte et, c’est vrai, c’est un point crucial. Mais il y a d’autres éléments à prendre en compte quand on doit faire le choix d’une récompense.

Si ce n’est pas fait, je vous invite d’abord à lire l’article « la caresse comme récompense » pour savoir pourquoi j’utilise personnellement la friandise et/ou le jeu comme renforçateurs.

Alors qu’est-ce qu’une récompense pertinente ? Vaste question. Ce qu’on espère en premier lieu, c’est qu’elle sera suffisamment motivante pour le chien à un moment donné, de façon à ce qu’il puisse se concentrer sur mon exercice ou ma demande, réussir et être récompensé, donc avoir tendance à reproduire ce comportement. Mais si j’essaie de travailler la durée d’une position et que ma friandise incite le chien à bondir toutes les deux secondes, voire à m’aboyer dessus ? Dans ce cas, je n’ai pas de problème d’appétence. Ou plutôt si, mais dans le mauvais sens. Il est fort possible que ce chien manque d’auto-contrôles, ce qui se travaille (en priorité), mais il est également probable que cette friandise-là, dans ce contexte d’apprentissage en tout cas, soit trop « forte », c’est-à-dire trop appétente, trop motivante, et donc incompatible avec l’exercice que je tente de réussir. On peut être confronté à ce genre de situations avec un chien très gourmand, en intérieur le plus souvent mais aussi dans un extérieur jugé neutre par le chien, comme dans son jardin ou sur un itinéraire de balade connu mais peu stimulant. Dans ce cas, on peut essayer avec de la nourriture moins alléchante, comme une croquette basique.

Okay, donc une récompense efficace est à la fois suffisamment attrayante pour motiver le comportement attendu MAIS son appétence (relative au chien) ne doit pas mettre l’animal en difficulté (en créant trop de volonté de l’obtenir et donc une perte de contrôle moteur et de réflexion).

Et c’est tout ? Bon, ça va, en fait.

Mais en fait non…

A l’occasion, je filmerai la scène pour que tout soit plus parlant, mais pour approfondir, je prendrai l’exemple de Guenji.

Avec l’âge, Guenji est devenue assez gourmande. Bon, elle a toujours aimé les friandises ; d’ailleurs elle a appris l’essentiel par ce biais, puis le jeu est devenu le renforçateur des comportements maîtrisés. Cela fait un an ou deux maximum qu’elle bave à l’idée d’un truc à mâcher ou quand la cuillère tourne dans sa gamelle pour mélanger les légumes et les compléments aux éléments plus appétents de sa gamelle de BARF. Son sang essentiellement de golden la prédispose aussi à cet attrait pour la nourriture. Et pourtant, avec elle, la récompense alimentaire n’est parfois pas du tout indiquée.

Parce qu’elle est devenue trop « forte » ? Non. Parce que même la plus insipide des croquettes peut conduire à l’échec.

Pour le hooper (sport canin de franchissements d’obstacles à distance), je me suis décidé à lui apprendre le « droite » et le « gauche ». Rien de bien compliqué ; on choisit un côté à enseigner en premier (la droite, pour elle) et c’est parti : un obstacle face à elle puis un autre sur la droite, rien d’autre. Demande de « en avant » qui la fait décoller vers le premier hooper puis forcément prendre la direction du second, sur la droite donc, car elle a appris à aller chercher les éléments plus en avant. Il suffit donc de demander « à droite » quand elle y va puis de féliciter dès que l’obstacle est franchi.

Si je n’utilise que ma voix, le premier coup est une réussite, le second aussi, le troisième certainement, mais on observe facilement que la tension monte en elle : Guenji revient vers moi rapidement, dans un galop saccadé, comme si elle ne comprenait pas pourquoi je félicitais verbalement sans rien offrir de plus. Si j’insiste, elle finira par bondir près de moi sur ces retours et par aboyer à chaque commande vocale (signe qu’elle évacue un certain stress et ne comprend pas ce que j’attends réellement).

=> je peux avoir l’impression de récompenser un chien qui reste joyeux, qui continue de s’exécuter car l’exercice est « évident », mais qui ne se sent pas récompensé pour autant et qui est en tension, donc qui possiblement n’apprend plus grand-chose.

Si je fais la même chose avec une friandise, quel que soit son niveau d’attrait pour ma chienne (de la friandise semi humide industrielle sans goût aux morceaux d’abats cuits, ce qu’elle préfère), on observera à peu près la même chose : sur les tout premiers essais, Guenji exécutera l’exercice calmement et reviendra chercher la nourriture. Mais très rapidement, on sera témoin de la même montée d’excitation qui la fera revenir à ma main sans prendre la récompense, ou en la prenant mais en la faisant tomber au sol, comme si ce n’était pas ce qu’elle attendait. En insistant, on aura donc les mêmes aboiements possibles durant l’exercice et donc une perte de concentration, puis une inefficacité de l’apprentissage.

Et avec le jouet alors ? Dans le schéma, « en avant », « à droite », « oui mon chien ! » + lancer (ou retour à moi pour tirer sur un tug ou boudin), on pourra recommencer à l’infini. Guenji reproduira la séquence avec la même joie initiale mais avec une application durable, sans pression sous-jacente (pas de bonds, pas d’aboiements).

Est-ce que cela signifie que ma chienne préfère le jouet à la friandise ? C’était vrai, en tout cas ; il y a quelques années, j’aurais pu lancer une côte de bœuf et une balle en même temps, elle serait allée chercher la balle, sans aucun doute. Aujourd’hui, honnêtement, je ne sais pas. Quand je prépare les gamelles et que je ne lui donne pas la sienne car on va à l’agility – et que son ventre ne doit pas être plein avant de faire de l’exercice – évidemment, elle me suit dehors tandis que les autres mangent, mais il y a comme un temps d’arrêt et, dans son regard, cette interrogation qui n’existait pas avant, genre « mais… et moi je mange pas du coup...? » alors qu’elle serait sortie, ravie et sans demander son reste, auparavant.

Est-ce que c’est réellement une question de préférence ontologique ? Je ne crois pas. Ce que je pense, c’est que dans des phases d’apprentissage d’exercices en mouvement, il n’y a que le jeu qui lui permet de revenir à un état d’esprit (émotionnel) normal entre les phases de travail.

Je vous propose de schématiser les choses par un graphique :

Graphique : excitation/type de récompenses

Si l’on dit que :

1 représente un état d’esprit relativement neutre, pas dans le bien être mais dans l’excitation (en lien avec la capacité de concentration, le rythme cardiaque, la fatigue physique et émotionnelle, laquelle conditionne la disponibilité du chien et donc la réussite de l’exercice)
3 est le niveau d’intensité normal au travail (excitation relative, due à la pratique d’une activité ou d’un apprentissage mais permettant à l’animal de rester concentré et à l’écoute)

il apparaît que la seule récompense qui amène un retour à la normale émotionnelle est le jeu (de n’importe quel type pour Guenji). Avec les autres récompenses, aussi plaisantes soient-elles, on observera une intensité qui va croissant et qui donc, rapidement, ne place pas le chien dans un cadre d’apprentissage idéal.

En effet, j’ai pris l’exemple d’un exercice évident, dans le sens où il n’est pas réellement possible pour Guenji de se tromper (car, à son niveau, il n’y a pas vraiment la possibilité d’échouer en évitant un obstacle – encore que, à force de cultiver l’excitation...) Mais il serait parfaitement vérifiable d’établir cet autre type de graphique si l’on décidait, par exemple, après avoir enseigné le droite ET le gauche, de poser un premier hooper en face de nous, puis un autre de part et d’autre du premier, de manière à ce que la chienne puisse choisir d’aller à droite ou à gauche :

Graphique : probabilité d'échec/type de récompenses

1 représente la probabilité maximum de faire le mauvais choix, 0,5 étant neutre car le chien peut théoriquement tout autant choisir d’aller à droite qu’à gauche, donc a une chance sur deux de faire le choix indiqué par l’humain (et de se tromper).

L’idée est que, pour Guenji, comme les autres formes de récompenses la font monter en excitation (non pas parce qu’elles sont trop « fortes » mais parce qu’elles ne sont pas vues comme telles et n’autorisent donc pas un retour à l’état normal pour ma chienne ; en fait, c’est la frustration de la non-obtention de ce qui lui plairait qui cultive l’excitabilité), elles augmentent la possibilité d’échec de l’exercice, tandis que le jeu, qui l’intéresse suffisamment mais lui permet également de redescendre en pression entre les phases de travail, va de son côté entraîner une progression et abaisser, lentement mais sûrement, la probabilité d’erreur.

Evidemment, la représentation est mathématiquement incorrecte, d’autant que beaucoup d’autres éléments peuvent influencer une réussite ou un échec sur une phase d’exercice (mouvement ou posture que je pourrais faire/prendre sans même en avoir conscience, changement de ton, conditionnement à aller toujours du même côté plusieurs fois de suite, élément perturbateur soudain...), mais cette schématisation sert surtout à illustrer à quel point une récompense non pertinente pour un chien pourrait constituer un frein à son éducation (ou à la réussite d’un apprentissage précis).

Je vous ai parlé de Guenji, mais chaque chien est différent. Il y a des individus qui justement manqueront cruellement de contrôle dans le jeu et qui, une fois qu’ils auront eu accès au jouet, ne seront plus capables de se concentrer. Certains seront apaisés par la traction mais excités par un jouet lancé (ou inversement ?). Il doit aussi y avoir des individus qui ne s’exciteront pas face à une voix enjouée et qui pourront reproduire beaucoup plus longtemps les séquences juste avec une félicitation vocale, sans se sentir frustré. Nagg, dont les auto-contrôles sont meilleurs, est beaucoup plus adaptable que sa grande sœur : voix, jouet ou nourriture, tout pourra être une récompense efficace, en fonction du contexte. C’est plutôt son état émotionnel de base (au moment de commencer) qui me conduira vers un type de récompense (si sa motivation est déjà grande, que son excitation est déjà palpable, la vue du jeu pourra mener à des ratés qui n’existent plus une fois le jeu rangé/posé plus loin, par exemple).

En résumé, pour être pertinente, une récompense devra :

→ être adaptable au contexte : évoluer vers plus de goût et d’odeur quand le niveau de stimulations de l’environnement augmente,

→ être suffisamment motivante pour que le chien soit disponible pour nous, au moment où l’on souhaite enseigner/demander quelque chose

→ être assez « neutre » pour ne pas faire monter le chien en pression et conserver une attention qui autorise l’apprentissage

→ être un renforçateur puissant, qui amène un vrai plaisir, mais qui aussi permet au chien de se sentir satisfait de l’avoir obtenu = qui le laisse intéressé mais serein face à l’idée de continuer (ou de changer d’exercice).

Finalement, ce que vous recherchez, c’est pour une situation précise (ou un ensemble de situations similaires, comme le sont pour Guenji les apprentissages impliquant une course) une récompense qui est motivante – sans excès – et aussi non frustrante.

De ce fait, il n’y a pas de « bonne récompense » universelle. Il faudra toujours observer son chien et l’environnement pour s’adapter et ainsi pouvoir obtenir (et renforcé) le comportement souhaité. C’est grâce à de nombreux essais-erreurs, de multiples partages éducatifs au fil du temps que vous pourrez savoir ce qu’est une récompense efficace pour votre duo.

Sachez tout de même que plus vous cultivez un relationnel positif par le biais notamment de respect des besoins du chien et plus vous travaillez les auto-contrôles, plus vous avez de chance de pouvoir avoir un impact positif avec n'importe quelle récompense lors des enseignements.

Margot Brousse Freed Dogs

Article publié en avril 2020