Používáním těchto stránek souhlasíte s ukládáním souborů cookies na vašem zařízení.

Klikat či neklikat? Klikr trénink v praxi

Rádi byste také více pronikli do tajů klikr tréninku? Pak zde pro vás máme další díl seriálu o moderním výcviku psů z pera vynikajícího trenéra Roberta Zlochy. Pojďme se tedy na tu malou „zázračnou“ krabičku podívat blíže…


Klikat či neklikat? Klikr trénink v praxi
Robert Zlocha 26.2.2020 4171x Moderní výcvik psů

Klienti se mne často ptají, jestli mají „zázračnou“ krabičku jménem klikr vůbec používat. Klikr je taková obyčejná schránečka, která při stisknutí vydává zvuk. Nic víc, nic míň. Jeho „kouzelnou“ moc mu propůjčuje jen to, s čím jeho zvuk spojím...

Když kliknu, a po pejskovi hodím botu a pak to celé zopakuji, při dalším kliknutí začne hafan pelášit hlava nehlava pryč. V běžném životě však většinou klikr spojujeme s odměnou, nejčastěji ve formě jídla. Tedy požádám pejska o nějaké chování nebo si na nějaké počkám. V momentě, kdy se mi chování líbí, kliknu (říkám mu tím „tohle se mi líbí“) a poté ho odměním.

Proč se ale zdržovat kliknutím, když můžu psa rovnou odměnit?

Klikat či neklikat? Klikr trénink v praxi

Protože díky klikru získávám velkou výhodu. Pes se může soustředit na svoji práci místo toho, aby sledoval moje ruce sahající pro pamlsek. Na zachycení kliknutí má přece uši. A to často velikánské. Bez kliknutí se tímto označením stává právě pohyb mých rukou. Psi svým chováním „prásknou“ páníčky, kteří klikr nebo jeho alternativu nepoužívají. Takový pes nespustí ze svých očí ruce majitele a při sebemenším pohnutí směrem ke kapse přestává držet koncentraci na svůj úkol. Nemluvě o tom, že zvuk klikru je výrazný a krátký, a tím přesně určuje moment v chování psa, které chci odměnit. Díky tomu krásně zpřesňuje komunikaci.

Musí to být vždy jen klikr?

Klikr ale můžu v tréninku zaměnit za jiný zvukový singál: „hodný“, „šikovný“, „ták je dobře“ a mnohé další. To poslouží jako slovní „kliknutí“ (jinými slovy marker nebo bridge). Tato varianta je ale delší, a kvůli tomu nemusím přesně trefit chování, které chci označit. A navíc tato slova často používám i bez odměny, takže ztrácejí pro psa na významu.

Moderní trénink naštěstí nabízí řešení.

Použít můžeme krátký slovník „klikr“ jako slovo „teď“, „tak“, „šik“ nebo „jo“. Se psem se dohodneme, že vždy po vyslovení takového slova dostává odměnu a zároveň toto slovo vyslovíme výrazně (až úderně) a rychle. Jenomže, co když je klient plachý, a slovní „kliknutí“ jenom potichoučku šeptá nebo vysloví úplně stejně, jako vyslovuje například „teď“ v běžné řeči? Nebo ho právě bolí v krku? Slovní signál poté opět trochu ztrácí na významu, takže mechanický zvuk klikru přichází vhod.

Já sám ale momentálně klikr v praxi moc nepoužívám. Klienti z něj totiž mají někdy zbytečný strach. Aby dobře fungoval, musíte ho mít vždy u sebe a navíc zabírá místo v ruce. V trénincích jsem si navíc všiml, že se hodně uživatelů stává na klikru tak trochu závislých. V jiné situaci pak mají problém použít slovní signál. I když je fakt, že neposednější klienty dokáže krabička v ruce svým způsobem zklidnit.

A co  klasické kliknutí versus slovo věda?

Klikat či neklikat? Klikr trénink v praxi

Podíval jsem se na tři studie provedené na psech (Cinzia Chiandetti 2016, Lindsay Wood 2006, Smith and Davies 2008) a závěry byly rozporuplné. Z té poslední vyplývá, že mezi používáním klikru a slovního signálu není rozdíl (což jen tak pro zajímavost vyšlo i při dvou dalších studiích provedených na koních). Lindsay Wood naopak zjistila, že se díky klikru (oproti slovnímu markeru „good“) zvýšila rychlost učení až o třicet procent. Cinzia Chiandetti a její kolegové se dobrali k ještě většímu zrychlení v učení (i když studie nebyla zaměřená na rychlost, ale na schopnost generalizace naučeného chování). Jen tak pro zajímavost – badatelé zde používali slovní signál „bravo“. Hádáte správně, za výzkumem stáli Italové.

Pro ty, co klikr ani jakoukoliv slovní alternativu nepoužívají, vyšel poslední výzkum ještě hůře. Psi se naučili otvírat chlebovník (úkol učený u jednapadesáti psů zahrnutých ve studii) s klikrem průměrně za dvanáct minut a osmdesát pokusů. Se slovním markerem za jednadvacet minut a sto deset pokusů a při pouhém doručení jídla za dvacet sedm minut při sto dvaceti pěti pokusech. Celkem slušný rozdíl, že? Zajímavá by byla pak i studie, která by ukazovala použití běžné dlouhé fráze typu „ták je hodný“. Myslím, že vzhledem k častému neodměňování po této frázi bychom se dostali ještě na řádově horší čísla. Takže takové označení je možná fajn na udržování chování, ale na učení něčeho nového nemusí být příliš efektivní.

Uživatelé klikru často zapomínají na jednu zásadní věc...

Pro „klikr trénink“ není vlastně zas tak podstatné samotné klikání. Jde o koncept učení pomocí pozitivního posilování. Tedy učení pomocí úspěchu, motivace. V tomto systému se trest využívá až jako poslední možné řešení a naopak se nastavují situace tak, aby pes uspěl. Učení se rozkládá do takových kroků, aby byly pro psa pořád pochopitelné. Klikr sám o sobě tedy z nikoho skvělého trenéra neudělá. Tím také odpovídám na otázku položenou na začátku. Ne, klikr pro práci s pozitivními metodami nepotřebujete. Může však trénink usnadnit a zefektivnit. Takže není náhoda, že velká část světových trenérů psů i dalších zvířat používá klikr jakou pevnou součást svého repertoáru „markerů“.

Klikat či neklikat? Klikr trénink v praxi

Časté dilema při používání klikru a jeho alternativ je odměňování při „ukliknutí“, tedy když kliknu při chování, které jsem vůbec nechtěl odměnit. Moje pravidlo v takové situaci je jednoduché. Pokud se mi to stane jednou za čas, tak to prostě ignoruji, neodměním a pokračuji dál. Pes mi pak totiž může nechtěné chování nabízet s větší frekvencí, což vede v konečném důsledku často k větší frustraci (psa i majitele), než jedno neodměnění. Při častém „ukliknutí“ je pak ale na místě zamyšlení, jestli nekladu příliš vysoké nároky na sebe nebo na psa a trénink zkusit nastavit lépe.

Když tuto ideu rozvedeme dál, tak se dostaneme k dalšímu velice zajímavému tématu. Odměňovat kliknutí vždy (nepočítám teď zmíněné „ukliknutí“) nebo střídat odměnu s neodměněním? „Rozvrhů“ odměň vědecká literatura definuje mnoho, ale v praxi sám používám téměř jenom tyto tři: Odměňuji chování pořád (vždy odměním chování, samozřejmě v souladu s navyšováním nebo snižováním kritérií, za které zvíře odměnu dostává). Odměňuji chování nahodile (jednou odměním, jednou neodměním, dvakrát odměním, jednou neodměním atd.). Odměňuji chování podle výkonu (odměním pouze průměrné nebo nadprůměrné chování atd.).

Pokud s klikrem začínáte, následující odstavec můžete přeskočit a zapamatovat si, že když už kliknu, tak vždy odměním (nepočítám zmíněné „ukliknutí“). Pojďme se teď podívat na variantu, která zní lákavě. Kliknu, když se mi chování líbí a někdy odměním, někdy neodměním. Tady přichází na řadu několik experimentů pod hlavičkou Jesuse Rosalese Ruize. V studiích zkoušeli několik variant, ve všech  psa naučili nějaké chování a chtěli jej udržet funkční i nadále. V první variantě psa po kliknutí vždy odměnili. Skvělé, pes se učil i udržoval chování velice dobře. V druhé variantě vždy klikli za správné chování, ale odměňovali variabilně (nahodile). Udržení chování u psa se ale zhoršilo. Což jde na první pohled v kontrastu s tím, co nás učí věda. Tzn. pokud chování vytvoříme, tak jej dokážeme udržet v podobné kvalitě i při variabilním odměňování (někdy odměním, někdy neodměním atd.). A právě tady přichází nejzajímavější část. Vědce překvapilo, proč výsledek jejich studie, tedy zhoršení chování při střídání „odměny / neodměny“ vůbec neodpovídá zažitým postupům a informacím. Chybu totiž ve studii neudělali. Za problémem stál jednoduchý princip. Když totiž kliknu, pes očekává odměnu. Pokud ji nedostane, tak se po ní pídí a jeho koncentrace jde dolů (už se tolik nesoustředí na to, co má dělat). Pokud ale vědci použili jiný signál, který říká psovi, že je na dobré cestě, resp. dělá vše správně, ale právě nedostává odměnu, tak bylo vše opět v pořádku (KGS - Keep going signal). V praxi to vypadalo tak, že když se vědcům chování líbilo, tak klikli a pes dostal odměnu nebo použili KGS signál (což může být například nějaká slovní pochvala „šikovný“) a odměnu nedali. Tím pádem nebyl pes zmatený, jestli dostane odměnu nebo ne a zároveň dosáhli toho, že nemuseli vždy odměňovat a pes udržel kvalitu chování. Vše do sebe tedy opět hezky zapadlo.

Na závěr ještě doplním praktický tip, nejprve pro začátečníky.

Klikat či neklikat? Klikr trénink v praxi

Ty bude nejspíš zajímat, že mezi kliknutím a odměnou musí být alespoň maličké zpoždění. Pokud kliknu a odměním ve stejný čas, pes si nebude příliš všímat kliknutí, ale toho, co je pro něj úplně jasné – pohybu mých rukou pro pamlsek. Dobu ale zbytečně neprodlužujte. Pokud kliknu a odměním s větším rozestupem, pes se nemusí kliknutí a odměnu spojit.

S rostoucí délkou tohoto rozestupu ale může vzniknout úplně jiný výsledek. V jedné ze studií tým vedený opět Jesusem Rosalesem Ruizem zjistil, že pokud je mezi kliknutím a odměnou rozestup pět sekund, i zkušený pes začne nabízet různá jiná chování (tzv. pověry). Proč? Protože za těchto pět sekund nabídl jistě ještě něco a dostal za to vlastně přímou odměnu. Zkušení trenéři se s Ruizem ale hádali, že jejich psi to dovedou. A částečně měli pravdu. Kde byl tedy zakopaný pes“? Pokud po kliknutí spustím svůj rituál, například jdu vždy ke kbelíku s jídlem (i když mi to trvá pět sekund), tak to zkušenější pes pochopí a pravděpodobně se nezačne vytvářet pověrčivé chování. Protože trenér vyplní zmíněný čas. Může to fungovat i opačně, že pes běží zpátky pro jídlo a může být od jídla i pět sekund běhu. Problém tedy nastává, pokud tento čas není ničím vyplněn. V tomto je krása vědeckých studií, často odhalí i takové maličkosti, které nám při tréninku zůstávají dlouhé roky skryty.

 

Foto: Nikola Kolářová, archiv redakce

Klikat či neklikat? Klikr trénink v praxi
Kam dál ...